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머리말 


위대한 령도자 김정일동지께서는 다음과 같이 지적하시였다. 

《과학기술을 빨리 발전시키기 위하여서는 또한 다른 나라의 선진과학 
기술을 적극 받아들여 야 합니다. 

다른 나라의 선진과학기술을 받아들이는것은 나라의 과학기술을 최단기 
간에 세계적수준으로 끌어올리기 위한 중요 한 방도의 하나입니다.》 

( 《김정 일선집》，제 8 권，249 폐지) 

현대과학기술의 급속한 발전은 콤퓨터 한대의 연산속도로서는 해결할수 
없는 방대한 계산량을 가전 문제들을 수많이 제기하고있으며 이려한 
대규모과학기술계산문제들을 신속정확히 해결하자면 높은 성능을 가진 
병렬를퓨터체계률 개발하고 그것을 효과적으로 리용하여야 한다. 이려한 
현실적요구로부터 세계적으로 수백〜수천개의 처리기들을 각이한 방식으로 
결 합한 성 능높은 병 렬콤퓨터 체 계 들이 광범 히 개 발운영 되 고있다. 

오늘날 병렬콤퓨터개발기술은 값비싼 전용를류터로부터 개인용콤퓨터 
( PC ) 와 같은 일반화된 요소들을 고속이 써네 트망으로 결 합한 무리 방식 의 
병 렬콤퓨터 체계개발방향으로 나가고있다. 무리 방식의 병 렬콤퓨터 는 전용 
병렬콤퓨터에 비하여 체계구축이 간단하며 확장성이 좋고 경제적효과성이 
높은것으로 하여 현재 병렬콤퓨터체계개발의 기본추세로 되고있다. 그러나 
그 우에서 실행되는 병렬응용프로그람의 개발은 프로그람작성자가 병렬 
프로쎄스들사이의 통신문제를 고려하여야 하므로 매우 복잡하고 어려운것 
으로 되고있다. 

여 러 가지 병 렬프로그람개 발수단들의 특성 을 잘알고 그것 을 합리 적 으로 
리용하는것은 방대한 계산량을 가진 계산문제들을 효과적으로 병렬처리 
하기 위한 필수적 요구로 나서고있다. 

무리방식의 병렬를퓨터에서 현재 가장 널리 리용되고있는 병렬프로그람 
작성 수법은 통보전달대면 부 (Message Passing Interface ) 서고에 기초한 
방법이다. 이 방법에서는 병렬프로그람을 통신함수들에 의하여 실행과정에 
서로 통보를 주고받는 병렬프로쎄스들의 모임으로 고찰한다. 여기서 병렬 
프로그람작성은 보통 Of 포트란과 같은 언어로 작성된 직렬프로그람에 
통신함수들을 리용하여 병렬성을 추가해주는 방법으로 진행한다. MPI 병렬 
프로그람작성에 리용되는 통신함수들의 모임을 MPI 서고라고 한다. 

이 책은 3개의 장으로 구성되 여있다. 

제 1 장에 서 는 병 렬프로그람의 일반개 념 과 병 렬프로그람개 발의 한가지 



수단인 MPI 를 개발한 경위와 특징에 대하여 간단히 언급하고 MPI 병렬 
프로그람들을 개발할수 있는 기초적인 함수들과 그것들을 리용하는 실례들 
을 주었다. 

제 2 장에서는 매개 MPI 함수들의 기능을 통신방식과 마디점구성방법 
등으로 나누어 실례를 들어주고있다. 

제 3 장에서는 MPI 프로그람작성방법을 실례를 들어 설명한다. 



제 1 장 MPI 의 기 초 
제 1 절 병 렬프로그람과 MPI 

1. 병렬프로그람의 개념 

병렬프로그람이란 무엇인가를 알기 위하여 먼저 가장 간단한 병렬알고 
리듬을 고찰해보기로 한다. 

아래에서는 사용자로부터 2 개의 옹근수값 nl 과 n 2 를 입력받아 그 사 
이의 옹근수들을 모두 더한 합 nl +...+ n 2 를 구하는 일감을 2 개의 처리기 
로 수행하는 병렬알고리듬을 보여주고있다. 2 개의 처리기에서 각각 실행 
되고있는 매개 프로쎄스는 아래와 같은 작업을 수행하게 된다. 


단계 

프로쎄 스 1 

프로쎄 스 2 

1 

사용자로부터 nl , n 2 를 

입 력 받는다. 

프로쎄스 1 로부터의 통보를 
기다린다. 

2 

nl ~ n 2 를 두개의 부분 ( nl 〜 m , 
m +1 〜 n 2) 으로 나눈다. 

프로쎄스 1 로부터의 통보를 
기다린다. 

3 

프로쎄스 2 에 통보 ( m + l ~ n 2) 를 
보낸다. 

프로쎄 스 1 로부터 의 

통보 ( m + l ~ n 2) 를 받는다. 

4 

nl~m 을 더한 결과 ( resultl ) 를 
구한다. 

m +1 〜 n 2 을 더한 결과 ( result 2) 
를 구한다. 

5 

m +1 〜 n 2 을 더한 결과 ( result 2) 
를 프로쎄 스2로부터 받는다. 

프로쎄스 1 에 통보 ( result 2) 를 
보낸다. 

6 

resultl 과 result 2 를 더 한후 
출력하고 끝낸다. 

프로그람을 끝낸다. 


매우 간단한 알고리듬이지만 프로그람에서는 망으로 련결하고 자료를 
주고받는 등 일련의 처리절차를 서술하여야 한다. 

이 려 한 통보전달방식 의 병 렬처 리 를 실현할 목적 으로 통보전 달함수들을 
제 공하였으며 이 것을 서 고화한것 이 통보전달대 면부 ( MPI ) 서고이 다. 

MPI 병렬서고는 사용자에게 통보전달과 관련되는 다양한 함수들을 제공 





해줌으로써 병렬응용프로그람작성자의 부담을 줄이고 보다 신뢰성있는 
프로그람을 작성할수 있도록 한다. 

MPI 규약에 따르는 통보전달서고들가운데서 가장 널리 리용되고있는것 
은 LAM MPI 와 MPICH 를 들수 있다. 그러나 이것들은 모두 MPI 표준 
규약에 따르므로 이것들사이 에 원천코드가 100% 호환된다는 우점 이 있다. 

2. MPI 의 특징 

MPI 는 Sillicon Graphics Origin 2000, Cray T 3 D , Cray T 3 E , IBM SP 2 
등과 같은 여 러 가지 기 종의 고성 능병 렬콤퓨터 체 계 들에 서 통보전 달방식 의 
병 렬프로그람작성 을 위 한 기 본수단으로 되 고있다. 

MPI 는 동종 및 이종를퓨터망에서도 리용할수 있으며 분산기억방식과 
공유기 억방식의 콤류터들에서 다 잘 동작한다. 

MPI 프로그람의 가장 중요한 특징은 MPI 가 가상콤퓨터들사이의 가상 
통신망과 분산기억을 가진 가상다중콤류터를 제공하고있는것으로 하여 
사용자가 병렬프로그람을 작성할 때 무리의 구조적특성을 고려하지 않아도 
된다는것이다. 사용자는 다만 문제해결에 필요한 프로쎄스의 개수만을 
요구하고 이 프로쎄스들사이의 위상만을 결정하면 된다. MPI 는 사용자의 
이려한 요구를 구체적인 병렬콤퓨터체계에서 실현한다. 결국 MPI 는 
병 렬프로그람의 이식성을 보장하는 가상환경 에서 동작한다. 

3. MPI 의 병 렬화수법 과 프로그람모형 

병렬프로그람의 효과성은 계산시간 대 통신시간의 비로 나타난다. 총 
계산시간에서 통신시간이 작을수록 효과성은 더욱 높다. 통보전달방식의 
병렬처리에서 계산과 통신사이의 최량비를 보장하는 방법은 호상작용이 
적 은 블로크사이 의 병 렬화를 진 행 하는 큰립 도병 렬화이 다. 

MPI 병 렬프로그람의 계산모형 은 아래의 2가지 로 나눈다. 

MPMD 계산모형: MPI 프로그람은 프로그람 자체의 고유한 조종하에 
자기기능을 수행하면서 통보들의 송수신을 위한 표준서고함수들에 의하여 
호상작용하는 독자적인 프로쎄스들의 총체이다. 결국 MPI 프로그람은 
일반적 으로 MPMD 계산모형 (Multiple Program-Multiple Data ) 을 실현한다. 

SPMD 계산 모형: 여기서 모든 프로쎄스들은 같은 프로그람의 각이한 
가지들을 실행한다. 이려한 방식은 과제가 같은 알고리듬에 의하여 부 



분과제들로 충분히 분할될수 있는것과 관련된다. 현실에서는 이러한 
프로그람작성모형과 자주 맞다들리게 된다. 이와 같은 SPMDCSingle 
Program-Multiple Data) 모형을 때로는 자료병렬화라고 한다. 간단히 
말하여 이 수법에서는 과제의 초기자료들이 프로쎄스들에 따라 분할되지만 
모든 프로쎄스들에서 알고리듬은 꼭같으며 이 알고리듬의 동작이 이 프로 
쎄스들에 있는 자료에 의하여 갈라진다. 


제 2 절 MPI 프로그람작성 의 초보 

1. 가장 기본적 인 6 개의 MPI 함수 

MPI 에는 200 여개 정도의 많은 함수들이 정의되 여있다. 그러 나 대부분 
의 MPI 프로그람들은 아래에 소개되는 6 개의 기초적 인 함수들의 조합으로 
실현될수 있다. 

이 함수들은 다음과 같다. 

- MPI_Init(&argc, &argv) 

프로그람의 입 구파라메 터 들로 mpi 환경 을 초기 화한다. 입 구파라메 터 
지정이 없으면 기정값들을 리용한다. MPIJnitO 함수는 모든 MPI 프로그람 
들에서 다른 MPI 함수들을 호줄하기 전에 반드시 서술하여 야 한다. 

- MPI_Finalize() 
mpi 환경을 끝낸다. 

MPI 프로그람에서 호출되는 모든 MPI 함수들은 MPIJnitO 함수와 
MPI_Finalize() 함수사이에서 호출되여야 한다. MPI_Finalize() 함수의 다음 
에 MPI 함수들은 서술하는것은 아무런 의미도 없다. 

- int MPI_Comm_rank(MPI_Comm comm, int *rank) 

지정된 통신기 (comm) 안에서 자기(이 함수를 호출한 프로쎄스)의 프로 
쎄스번호 (rank) 를 얻는다. 

- int MPI_Comm_size(MPI_Comm comm, int *size) 

지정된 통신기 (comm) 에서 실행되는 프로쎄스의 개수 (size) 를 얻는다. 
size 를 통신기의 크기라고도 부론다. 

- int MPI_Send(void ^message, int count, MPI_Datatype datatype, int 
dest, int tag, MPI_Comm comm) 


이 함수는 dest 로 지정된 처리기에 통보률 보낸다. 

매개 파라메터의 의미는 아래와 같다. 

• message - 송신통보(자료)률 보관하고있는 완충기의 시작주소 
•count - 송신완충기 안의 요소개수 

• datatype - 송신완충기 요소의 자료형 

• dest - 통보를 받아야 할 목적 프로쎄스의 번호 

• tag - 송신통보에 대한 표적 

• comm ■■목적프로쎄스 dest 와 자기 프로쎄스가 속해 있는 통신기 

- int MPI_Recv(void ^message, int count, MPI_Datatype datatype, int 
source, int tag, MPI_Comm comm, MPI_Status ^status) 

이 함수는 source 로 지정해준 프로쎄스로부터 통보를 받는다. 

• message - 수신통보를 보관할 완충기 

•count - 수신될 통보의 요소개수(받는 요소개수보다 작으면 오유발생) 

• datatype - 받을 통보의 자료형 

• source - 송신프로쎄 스의 번호 

- tag - 받은 통보를 확인하기 위한 표적 (MPI_Recv 에서의 tag 값과 
MPI_Send 에서의 tag 값이 같아야 한다.) 

• comm - source 와 자기 의 프로쎄 스가 속해 있는 통신기 

• status - 통보수신 상태 에 대 한 정 보 (source 와 tag) 

2. 실례프로그람 

이 프로그람은 두 프로쎄스들사이에 MPI_Send 와 MPI_Recv 함수를 
리용하여 자료를 주고 받는 과정을 보여주는 간단한 프로그람이다. 

프로그람은 다음과 같다. 

#include <stdio.h> 

#include “mpi.h” 

main(int argc, char **argv) 

{ 

int rank, size ； 
char data [10] ； 

MPI Status status ； 



MPI_Init(&argc, &argv )； 

MPI_Comm_rank(MPI_COMM_WORLD, &rank )； 
MPI_Comm_size(MPI_COMM_WORLD, &size )； 

if (rank == 0) { 

strcpy(data, “process 0” )； 

//MPI_CHAR 는 C 에서의 자료형 char 와 같다. 

MPI_Send(data, 10, MPI_CHAR, 1, 123, MPI_COMM_WORLD )； 

} 

elseif (rank == 1) { 

MPI_Recv(data, 10, MPI_CHAR, 0,123,MPI_COMM_WORLD,&status )； 
printf( “massage=%s, source=%d, tag=%d\n” , data, 
tatus.MPI_SOURCE, status. MPI_TAG )； 

} 

MPI_Finalize ()； 
return 0 ； 

} 

3. 실례프로그람의 실행과 결과 

우의 원천코드를 mpitest.c 로 보관한 후 아래와 같은 일련의 과정을 
거쳐서 실행해보자 (MPI 사용지도서를 참고할것). 먼저 mpicc 지령으로 
mpitest.c 를 콤파일，련결하여 실행가능한 MPI 병렬프로그람 mpitest 를 
얻은 다음 mpirun 지 령을 리용하여 2 개의 프로쎄스로 실행한다. 즉 
[root-] # mpicc -o mpitest mpitest.c 
[root-]# mpirun -np 2 mpitest 
message=process 0, source=0, tag=123 
[root-] # 



제 3 절 집합통신 


1. 기본적인 함수들 

집합통신함수들은 통신기안에 속해있는 모든 프로쎄스들이 모두 함께 
호출하여 야 하는 함수들이다. 

동신 기란 프로쎄스그룹내에서 동신을 진행하기 위 한 기구를 말한다. 

MPI 프로그람에서는 MPI_COMM_WORLD 라는 기본통신기를 리용할수 
있다. 이 통신기에는 생성된 모든 프로쎄스들이 포함된다. 그러나 사용자는 
임의의 프로쎄스들로 구성되는 새로운 통신기들을 생성하고 리용할수도 
있다(통신기와 관련된 MPI 함수들 (2 장 2 절)을 참고할것). 

- int MPI_Bcast(void ^message, int count, MPI_Datatype datatype, int 
root, MPI_Comm comm) 

통신기 (comm) 에 속한 모든 프로쎄스들에게 동일한 message 률 전송 
한다. 여기서 root 는 모든 프로쎄스들에게 통보를 방송하는 프로쎄스의 
번호이 다. 

root 프로쎄스의 message 에만 송신할 자료가 들어있고 다른 프로쎄스의 
message 는 수신통보를 보관할 공간이다. 

- int MPI_Reduce(void ^operand, void ^result, int count, MPI_Datatype 
datatype, MPI_Op op, int root, MPI_Comm comm) 

모든 프로쎄 스들에 다같이 들어 있는 피 연산수 operand 가 op 로 지 정 
해준 연산을 수행하면서 집합되는데 그 집합연산결과는 프로쎄스 root 의 
result 에 보관된다. 

operand : 연산이 적 용될 피 연산수 

result : 연산결과가 보관될 완충기(프로쎄스 root 에서만 의미가 있음) 
op: 수행될 연산을 지정하기 위한 연산코드 

root : 연산결과가 보관될 프로쎄스번호 


- int MPI_Barrier(MPI_Comm comm) 

통신기 (comm) 에 속한 모든 프로쎄스들의 실행을 모두가 MPI_Barrier 
률 호출 할 때까지 차단시킴으로서 동기화를 진행한다. 


- int MPI _ Gather(void * sendbuf , int sendcount , MPI_Datatype sendtype , 
void * recvbuf , int recvcount , MPI_Datatype recvtype , int root , 
MPI_comm comm ) 

모든 프로쎄스들이 프로쎄스 root 에로 자료 ( sendbuf ) 를 보내며 root 는 
받은 자료를 root 의 recvbuf 에 송신프로쎄스의 번호순서대로 차례로 넣 
는다. 

- int MPI _ Scatter(void * sendbuf , int sendcount , MPI_Datatype sendtype , 
void * recvbuf , int recvcount , MPI_Datatype recvtype , int root , 
MPI_Comm comm ) 

프로쎄스 root 에 있는 sendbuf 의 내용을 sendcount 의 크기로 토막내여 
매개 토막들을 모든 프로쎄스들에 있는 완충기 recvbuf 에 전송한다. 이때 
sendcount 의 크기로 나눈 여러개의 토막들중 첫번째것은 첫번째 프로쎄스 
로, 두번째것은 두번째 프로쎄스로 보내는 식으로 송신한다. 

MPI _ Gather 함수와 꼭 반대의 기능을 수행한다. 

- int MPI _ Allgather(void * sendbuf , int sendcount , MPI_Datatype 
sendtype , void * recvbuf , int recvcount , MPI_Datatype recvtype , 
MPI_comm comm ) 

MPI_Gather 함수와 마찬가지로 모든 프로쎄스의 완충기 sendbuf 의 
내용을 모든 프로쎄스의 완충기 recvbuf 에 순서별로 모아놓는다. 

MPI_Gather 함수와의 차이점은 한개 프로쎄스에로만 수집되는것이 

아니라 모든 프로쎄스에 다 수집된다는것이다. 

- int MPI _ Allreduce(void * operand , void ^ result , int count , 
MPI_Datatype datatype , MPI _ Op , MPI_Comm comm ) 

MPI _ Reduce 와 마찬가지로 모든 프로쎄스의 피연산수 operand 사이 에 
연산 op 를 적용하지만 그 결과를 모든 프로쎄스의 result 가 가진다는 
점 에서 차이난다. 

2. 실례프로그람 

아래에는 집합연산을 수행하는 MPI _ Reduce 함수의 사용실례를 보여준다. 
#include < stdio . h > 

#include ” mpi . h ” 


main(int argc, char **argv) 

{ 

int rank, size, result； 
int data=10; 

MPI_Init(&argc, &argv)； 

MPLComm_rank(MPI_COMM_WORLD, &rank)； 
MPI_Comm_size(MPI_COMM_WORLD, &size)； 

MPI_Reduce(&data, &result, 1, MPI_INT, MPI_SUM, 0, 
MPI_COMM_WORLD)； 
if (rank == 0) 

printf (” result = %d\n M , result)； 

MPI_Finalize()； 
return 0； 

} 

우의 프로그람을 mpireduce.c 로 보관한 다음 콤파일，련결，실행한 결 
과는 아래와 같다. 

[root 시# mpicc -o mpireduce mpireduce.c 
[root 시# mpirun -np 3 mpireduce 
result =30 
[root 〜 ]# 


제 4 절 MPI 의 기 타조작들 

i . 통신자료의 그룹화 

통신자료의 그룹화란 기 억구역 에 불련속적 으로 놓여 있는 여 러개의 
자료들을 모아서 한번에 전송할수 있도록 하나의 련속적인 자료로 만들어 
주는것을 말한다. 이려한 기능들이 필요한것은 통보전달함수를 여러번 
반복하여 통신하기보다는 이 자료들을 묶어서 하나의 자료형으로 만든 
다음 한번의 통신함수리 용으로 송신 하는것 이 더 편리 하기 때 문이 다. 



통신자료의 그룹화조작을 위한 일부 함수들을 아래에 소개한다. 


- int MPI _ Type _ struct(int count , int * array _ of _ block _ lengths , MPI_Aint 
* array _ of _ displacements , MPI_Datatype * array _ of _ types , MPI_Datatype 
* newtype ) 

이 함수는 C 에서 새로운 구조체자료형을 선언하는것과 류사하게 새로 
운 MPI 자료형을 선언한다. 

실례로 C 에서 struct test {int a [100] ； float b [50] ； double c ；} * N ; 
이라는 새로운 구조체형을 선언한다고 할 때 그에 대응하는 MPI 사용자 
정의 자료형을 만든다고 하자. 이때 count 는 새 자료형에 포함될 변수형 ( int , 
float , double ) 의 개수인 3, array _ of _ block _ lengths 는 포함될 블로크들의 
길이인 (100，50, 1), array _ of _ displacements 는 새로운 자료형에서의 각 
블로크들의 시작점 (어떤 기준으로부터의 변위)들의 배렬인 { & ( N -> a ) - 
N , &( N -〉 b ) - N , &( N -〉 c ) - N } , array _ of _ types 은 MPI 자료형의 배렬 
{ MPIJNT , MPI _ FL 0 AT , MPI _ DOUBLE } , newtype 은 사용자가 원하는 
임의의 자료형이름(실례로 MPI _ test ) 으로 해주면 된다. 


- int MPI _ Type _ contiguous(int count , MPI_Datatype oldtype , 
MPI_Datatype * newtype ) 

불련속적인 기억기에 위치한 자료를 련속적인 기억기처럼 사용할수 
있도륵 한다. 

- int MPI _ Type _ vector(int count , int block _ length , int stride , 
MPI_Datatype element _ type , MPI_Datatype * newtype ) 

규칙적인 길이와 간격을 가진 벡토르형태의 사용자자료형을 선언한다. 
실례로 아래와 같이 불련속적 인 기 억구역 에 배치되 여있는 자료를 아래의 
함수호출을 리용하여 하나의 련속적 인 벡토르자료형으로 만든다. 
MPI _ Type _ vector (3, 2, 2, MPI — INT , newtype ) 


1 
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- int MPI _ Type _ indexed(int count , int * array _ of _ block _ lengths , int 
* array _ of _ displacements , MPI_Datatype element _ type , MPI_Datatype 
* newtype ) 










불규칙적인 길이，불규칙적인 간격을 가전 배렬을 새로운 형태로 선언 
한다. 

array_of_block_lengths 는 각 블로크의 길이의 배렬인 {2, 1, 3} 
array_of_displacements 는 각 블로크의 변위의 배렬 {0,3,6} 
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- MPI_Type_commit(MPI_Datatype *newtype) 

MPI 에서 선언해준 새로운 사용자정의자료형을 MPI 에서 사용할수 
있게 한다. MPI 에서 선언한 새로운 자료형들(기본자료형 이 아닌)은 형선언 
시에는 통신완충구역의 내용과 련결되지 않는다. 따라서 이 함수를 리용 
하여 체계로부터 사용허가를 반드시 받아야 한다. 그렇치 않으면 우에서 
설명된 통신자료의 그룹화조작들에서 생성한 새로운 자료형들을 알수 없다 
는 오유통보를 내보낸다. 

- int MPI_Pack(void *pack_data, int in_count, MPI_Datatype datatype, 
void ^buffer, int size, int *position_ptr, MPI_Comm comm) 

pack_data 에 있는 count 개의 자료를 송신에 앞서 buffer 에로 묶기해 
준다. 

position_ptr 는 자료가 보관될 buffer 위치의 지적자이며 묶기 한 후에는 
이 지시기가 자동적으로 증가한다. 

size 는 바이트단위로 계산된 buffer 의 크기 이다. 

일부 다른 통신서고들 (MPI 가 아닌)은 불련속적인 몇개의 구역으로 
이루어진 자료들을 전송하기 위해 자료묶기함수，자료풀기함수들을 가지고 
있다. 여기서는 자료들을 송신하기 전에 어떤 완충구역에 묶어놓고 수신후 
에는 이 완충구역에서부터 자료를 푼다. MPI 에서 사용자정의자료형생성은 
대부분의 경우에 자료의 명시적인 묶기와 풀기률 피할수 있게 해준다. 

응용프로그람에서는 전송하고 수신할 자료의 위치만을 지정하며 MPI 는 
몇개의 불련속적인 구역으로 이루어진 완충기에 직접 접근한다. 

MPI 에서 묶기와 풀기조작들은 이전 서고와의 호환성을 보장한다. 또한 
이것들은 MPI 에서는 제공되지 않는 일부 기능들을 보장하고있다. 실례로 
통보는 개별적인 부분에 의해 수신될수 있으며 이 부분에서는 후에 실행 
되는 수신조작이 이전 부분의 내용에 관계될수 있다. 또다른 좋은 측면은 
묶기 및 풀기조작들이 보조적인 통신서고들을 쉽게 활용할수 있게 한다는 



것 이 다. 


- int MPI _ Unpack(void ^ buffer , int size , int * position _ ptr , void 

* unpack _ data , int count , MPI_Datatype datatype , MPI_comm 
comm ) 

MPI _ Pack 조작으로 묶기한 자료를 풀어준다. 
buffer 는 묶기 된 자료가 보관되 여있는 기 억 구역 이 다. 
position_ptr 는 묶기된 자료 buffer 의 첫 위치에 대한 지적자이며 
풀기 ( unpack ) 한 후에는 지시기가 자동적으로 증가한다. 
size 는 바이트단위로 계산된 완충기의 크기 이다. 
count 개의 자료률 풀어서 datatype 형으로 unpack _ data 에 복사해준다. 

2. 그룹과 위상 (Topology) 

다양한 통신기률 만들고 처리기들의 위상을 선언할수 있는 함수들로 
구성된다. 

- int MPI _ Group _ incl ( MPI_Group old _ group , int new _ group _ size , int 
* ranks _ in _ old _ group , MPI_Group * new _ group ) 

old _ group 에서 rank _ in _ old _ group 안의 번호들을 가진 new _ group_size 
개수의 프로쎄스들로 새로운 그룹인 new _ group 을 만든다. 

- int MPI _ Comm _ create ( MPI_Comm old _ comm , MPI_Group 
new _ group , MPI_Comm * new _ comm ) 

그룹을 통신기로 만들어준다. MPI _ Comm_group 과 MPI _ Group_incl 
함수와는 달리 집합연산은 단독으로 수행되서는 안되며 반드시 모든 프로 
쎄 스가 동시 에 수행 되 여 야 하는 조작이 다. 

- int MPI _ Comm _ split ( MPI_Comm old _ comm , int split _ key , int 

rank _ key , MPI_Comm * new _ comm ) 

동일 한 split_key 률 가지고 호줄하는 프로쎄스들을 묶어서 동일 한 
통신기 로 만든다. rank _ key 는 프로쎄스번호를 결정할 때 작은 순서 대 로 
작은 번호률 부여받는다. 

프로쎄스 0, 1, 2 는 split_key 1 로 호출하고 프로쎄스 3, 4，5 번은 


split_key 2 로 호출했을 때 동일한 이름 ( new _ comm ) 을 가진 두개의 
통신기가 생성된다. 만약 0 번 프로쎄스에서 new _ comm 으로 MPI _ Bcast 를 
호출하면 0，1，2 번으로 전송되고 3 번 프로쎄스에서 new _ comm 으로 
MPI _ Bcast 를 호출하면 3, 4, 5 번 으로 전송된 다. 

- int MPI _ Cart _ create ( MPI_Comm old _ comm , int number _ of _ dims , int 

* dim _ sizes , int ^ periods , int reorder , MPI_Comm * cart _ comm ) 
새로운 통신기 cart _ comm 을 생성해준다. 

old _ comm 과 cart _ comm 에 속해있는 프로쎄스들은 같지만 그것들의 
번호는 같지 않다. 

cart _ comm 의 프로쎄스들은 number _ of _ dims 차원의 행렬 구조 ( dim_size 
* dim_size ...) 로 재구성되며 그에 맞게 새로운 번호를 가지게 된다. 

periods 는 각 차원이 비선형인가 혹은 선형인가를 지정하는 기발이다. 
reorder 는 프로쎄스번호의 재순서화률 지시하는 기발이다. 

- int MPI _ Cart _ rank ( MPI_Comm comm , int ^ coordinates , int * rank ) 

coordinates [] 의 정보률 가지고 그에 해당하는 프로쎄스의 번호률 
구한다. 

coordinates [] = {2,4} 이면 프로쎄스배치 행 렬에서 2 행 4 렬의 프로쎄스 
번호를 돌려준다. 

coordinates [] 는 몇 렬 몇 행의 정 보를 가지 고있다. 

- int MPI _ Cart _ coords ( MPI_Comm comm , int rank , int number _ of _ dims , 

int ^ coordinates ) 

rank 를 가지고 그에 해당하는 coordinates [] 를 구한다. 

2 행 4 렬에 위치한 프로쎄스번호가 6 일 때 rank =6 로 함수를 호출하면 
coordinates !:] = {2, 4} 를 돌려준다. 

- int MPI _ Cart _ sub ( MPI_Comm grid _ comm , int * varying _ coords , 

MPI_Comm * comm ) 

2 *2 행렬인 경우 2 개의 통신기률 만든다. 

MPI _ Cart _ sub ( grid _ comm , {0, 1} , comm ) 을 사용하여 매 개 렬을 동일 
한 통신기로 묶어준다. 

varying_coords □는 매개 차원이 comm 에 속하는가를 알려 주는 론리값 


이다. 


3. MPI 자료형 과 MPI 연산형 

MPI 프로그람에서 자료를 전송 또는 송신할 때는 반드시 자료형을 함께 
지정해주어야 한다. 모든 자료통신은 바이트단위로 진행되기때문에 이것을 
원래의 자료형으로 해석하기 위해서는 자료형을 반드시 지정해야 한다. 

C 와 포트란의 모든 기초자료형 에 대응하는 MPI 자료형은 아래와 같다. 


MPI 자료형 

c 자료형 

MPI 자료형 

포트란자료형 

MPI—CHAR 

signed char 

MPI—CHARACTER 

character(l) 

MPI—SHORT 

signed short int 

MPIJNTEGER 

Integer 

MPIJNT 

signed int 

MPI—REAL 

Real 

MPI—LONG 

signed long int 

MPI_DOUBLE_PRECISION 

double precision 

MPI_UNSIGNED_CHAR 

unsigned char 

MPI_COMPLEX 

Complex 

MPI_UNSIGNED_SHORT 

unsigned short int 

■—LOGICAL 

Logical 

MPI—UNSIGNED 

unsigned int 

MPI_BYTE 

8 bit 

MPI_UNSIGNED_LONG 

unsigned long int 

MPI—PACKED 

MPI_Pack() 또는 

MPI_Unpack() 

조작으로 묶기 또는 

풀기한 자료 

MPI—FLOAT 

float 



MPI—DOUBLE 

double 



MPI_LONG_DOUBLE 

long double 



MPI—BYTE 

8 bit 



MPI_PACKED 

MPI_Pack() 또는 

MPI_Unpack() 

조작으로 묶기 또는 

풀기한 자료 




MPI _ Reduce () 와 같은 일부 집합연산함수들은 매개 프로쎄스로부터 
어떤 연산을 수행하면서 자료를 모아서 결과를 돌려주게 된다. 






이때 수행할 연산을 지정해주어야 하는데 MPI 에서 기정으로 리용할수 
있는 연산형들은 아래와 같다. 


MPI 집합연산형 

의미 

연산수자료형 (C) 

연산수자료형 ( 포트란 ) 

MPI—MAX 

최 대 값 (maxmum) 

integer, float 

integer, real, complex 

MPI_MIN 

최 소값 (minimum) 

integer, float 

integer, real, complex 

MPI_SUM 

총합 (sum) 

integer, float 

integer, real, complex 

MPI_PROD 

급하기 (product) 

integer, float 

integer, real, complex 

MPI_LAND 

론리 적 (logical 

AND) 

integer 

logical 

MPI_BAND 

비트론리적 (bit- 

wise AND) 

integer, 

MPI_BYTE 

integer, MPI_BYTE 

MPI_LOR 

론리 합 (logical OR) 

integer 

logical 

MPI_BOR 

비트론리합 (bit- 

wise OR) 

integer, 

MPI_BYTE 

integer, MPI_BYTE 

MPI—LXOR 

배 타론리 합 (logical 

XOR) 

integer 

logical 

MPI_BXOR 

배 타 적 인 

비트론리합 (bit- 

wise XOR) 

integer, 

MPI_BYTE 

integer, MPI_BYTE 

MPI_MAXLOC 

최대값과 위치 

float, double, 

long double 

real, complex, 

double precision 

MPI_MINLOC 

최소값과 위치 

float, double, 

long double 

real, complex, 

double precision 


제 5 절 MPI 프로그람시 작 

순차프로그람 《Hello world )) 와 같은 간단한 MPI 프로그람 《I am 
process ID )) 를 작성 하기 로 한다. 






#include < stdio . h > 
#include “ mpi . h ” 


main(int argc , char ** argv ) 

{ 

int rank , size ； 

MPI _ Init (& argc , & argv )； 

//size 에 함께 수행된 처리기의 개수가 할당된다. 
MPI _ Comm _ size ( MPI _ COMM _ WORLD , & size )； 

// rank 에 자기 (프로쎄 스)의 번호가 할당된다. 
MPI _ Comm _ rank ( MPLCOMM _ WORLD , & rank )； 

// 매개 프로쎄스는 아래의 printf 문을 수행한다. 
printf( M I am process % d\n \ rank )； 

MPI _ Finalize ()； 
return 0； 


아래의 지령은 3 개의 처리기가 동일한 프로그람을 수행하고있는것을 
보여주고있다. 

[ root @ node 56 시# mpirun -np 3 testl 
I am process 0 
I am process 1 
I am process 2 
[ root @ node 56 시# 


이제 매개 프로쎄스를 어떻게 조종하는지 실례프로그람을 통해 알아 
보자. 

#include < stdio . h > 

#include “ mpi . h ” 



main(int argc , char ** argv ) 

{ 

int rank , size ； 

MPI _ Init (& argc , & argv )； 
MPI _ Comm _ size ( MPI _ COMM _ WORLD , & size )； 
MPI _ Comm _ rank ( MPI _ COMM _ WORLD , & rank )； 

// 프로쎄스번호가 0 이면 
if (rank == 0) 

printf( M %d processes is runned \ n ", size )； 

// 프로쎄스번호가 0 이 아닌 프로쎄스이면 
else 

printf (” I am process % d \ n f, , rank )； 

MPI _ Finalize ()； 
return 0； 


[ root 〜] # mpirun -np 3 test 2 
3 processes is runned 
I am process 1 
I am process 2 


다음은 MPI 병렬프로그람의 아주 간단한 몇가지 실례이다. 


C 프로그람실례 

포트란 실례 

Hello _ world.c 

sendrecv.c 

matv.c 

wtime.c 

Hello _ world.f 

sendrecv.f 

matv.f 


Hello world.c 






#include < stdio . h > 
#include “ mpi . h ” 


main(int argc , char ** argv ) 

{ 

int node , numtask ； 

MPI _ Init (& argc , & argv )； 

MPI _ Comm _ rank ( MPI _ COMM _ WORLD , & node )； 
MPI _ Comm _ size ( MPI _ COMM _ WORLD , & numtask )； 

printf("Hello World !!! from node = % d \ n f, , node )； 

MPI _ Finalize ()； 
return 0； 


sendrecv.c 


#include < stdio . h > 

#include “ mpi . h ” 

main(int argc , char ** argv ) 

{ 

int node , numtask , nextup , nextdn , itag , size ； 
float sendbuf , recvbuf ； 

MPI_Status stat ； 

MPI _ Init (& argc , & argv )； 

MPI _ Comm _ rank ( MPI _ COMM _ WORLD , & node )； 
MPI _ Comm _ size ( MPI _ COMM _ WORLD , & numtask )； 


if (node != ( numtask -1)) nextup = node + 1； 



else nextup = 0； 

if (node != 0) nextdn = node - 1； 
else nextdn = numtask -1； 


printf ("node = % d , 
nextdn )； 

nextup = 

% d , nextdn = 

% d \ n \ node , nextup , 

sendbuf = node *0.1； 

itag = 22； 

size = 1； 




MPI _ Send (& sendbuf , 

size , 

MPI - REAL ， 

nextdn , itag , 

MPI _ COMM _ WORLD )； 



MPI _ Recv (& recvbuf , 

size , 

MPI - REAL ， 

nextup , itag , 


MPI _ COMM _ WORLD , & stat )； 

printf (” from %d received % e \ n M , nextup , recvbuf )； 

MPI _ Finalize ()； 
return 0； 


matv.c 

#include < stdio . h > 
#include “ mpi . h ” 


main(int argc , char ** argv ) 

{ 

int node , numtask , nextup , nextdn , itag , size , i , j ； 
float sendbuf [10], recvbuf [10], c [10], a [10] [10] ； 


MPI Status stat ； 



MPI _ Init (& argc , & argv )； 

MPI _ Comm _ rank ( MPI _ COMM _ WORLD , & node )； 
MPI _ Comm _ size ( MPI _ COMM _ WORLD , & numtask )； 

if (node != ( numtask -1)) nextup = node + 1; 
else nextup = 0； 

if (node != 0) nextdn = node - 1； 
else nextdn = numtask -1； 

printfC'node = % d , nextup = % d , nextdn = % d \ n M , node , nextup , 
nextdn )； 

for (i = 0; i < 10； i ++) { 
c [ i ] = 0.0； 

sendbuf [ i ] = 1.0* i *( node + l )； 

for (j = 0； j < 10； j ++) a [ i ] [ j ] = ( i *1.0 + j *0. l )*( node +1.0); 

} 

itag = 22； 
size = 10； 

MPI _ Send (& sendbuf , size , MPI _ REAL , nextdn , itag , 

MPI _ COMM _ WORLD )； 

MPI _ Recv (& recvbuf , size , MPI _ REAL , nextup , itag , 

MPI _ COMM _ WORLD , & stat )； 

for (i = 0 ；i < 10； i ++) 

for (j = 0 ；j < 10； j ++) c [ i ] = c [ i ] + a [ i ] [ j]*recvbuf [ j ]; 

for (i = 0 ；i < 10； i ++) printf( n %e \ n ", c [ i ] )； 

MPI _ Finalize ()； 
return 0； 



wtime.c 


#include < stdio . h > 

#include < time . h > 

#include “ mpi . h ” 

main(int argc , char ** argv ) 

{ 

int rank ； 

double start , end ； 

MPI _ Init (& argc , & argv )； 

MPI _ Comm _ rank ( MPI _ COMM _ WORLD , & rank )； 

start = MPI _ Wtime ()； 

sleep (7)； 

end = MPI _ Wtime ()； 

printf ( M PROC=%d Wall clock time =% f \ n ", rank , end - start )； 

MPI _ Finalize ()； 
return 0； 

} 

포트란 실례 
Hello world.f 


program hello _ mpi 2 


character *80 name 
include “ mpif . h ” 


call MPI INIT ( ierr ) 




call MPI_GET_PROCESSOR_NAME(name,ilength,ierr) 


write(6,*) "Hello World!!! from node ", name 
call MPI_FINALIZE(ierr) 


stop 

end 

send_recv.f 
program comm_mpi 
include ’mpif.h’ 

integer istatus(MPI_STATUS_SIZE) 
call MPI_INIT(ierr) 

call MPI_COMM_RANK(MPI_COMM_WORLD, node, ierr) 
call MPI_COMM_SIZE(MPI_COMM_WORLD, numtask, ierr) 

if (node .ne. (numtask-1)) then nextup = node + 1 

else nextup = 0 

endif 

if (node .ne. 0) then nextdn = node - 1 

else nextdn = numtask-1 

endif 

write(6,*) ’node = node,’ ； ’， ’nextup = ’， nextup, 

# ’nextdn = ’， nextdn 


sendbuf = node*0.1 



itag = 22 


call MPI_SEND(sendbuf, 1, MPI—REAL, nextdn, itag, 

# MPI_COMM_WORLD, ierr) 

call MPI_RECV(recvbuf, 1, MPI—REAL, nextup, itag, 

# MPI_COMM_WORLD, istatus, ierr) 

write(6,*) ’from nextup, ’ receive recvbuf 


call MPI_FINALIZE(ierr) 


stop 

end 


matv.f 

program comm_mpi 
include ’mpif.h’ 

integer istatus(MPI_STATUS_SIZE) 
call MPI_INIT(ierr) 

call MPI_COMM_RANK(MPI_COMM_WORLD, node, ierr) 
call MPI_COMM_SIZE(MPI_COMM_WORLD, numtask, ierr) 

if (node .ne. (numtask-1)) then nextup = node + 1 

else nextup = 0 

endif 

if (node .ne. 0) then nextdn = node - 1 

else nextdn = numtask-1 

endif 

write(6,*) ’node = node/ ； ’， ’nextup = ’ ， nextup, 



# 


nextdn = ’， nextdn 


sendbuf = node*0.1 


itag = 22 

call MPI_SEND(sendbuf, 1, MPI—REAL, nextdn, itag, 

# MPI_COMM_WORLD, ierr) 

call MPI_RECV(recvbuf, 1, MPI—REAL, nextup, itag, 

# MPI_COMM_WORLD, istatus, ierr) 

write(6,*) ’from ’ ， nextup, ’ receive ’， recvbuf 


call MPI_FINALIZE(ierr) 


stop 

end 



제 2 장 병 렬프로그람작성서고 MPI 

우에서는 일반적인 병렬프로그람과 MPI 의 기초적인 개념들과 일부 
실례에 대하여 보았다 . 여기서는 앞에서 설명한 MPI 의 기본함수들과 함께 
다른 다양한 MPI 의 함수들에 대하여 기능별로 실례를 주면서 고찰한다 . 

여기서는 C 프로그람에서 리용되는 MPI 함수들을 설명한다 . 

포트란프로그람에서 모든 MPI 함수들 (MPI_WTIME 과 MPI_WTICK 는 
제외)은 C 에서와는 달리 파라메터목록의 끝에 보충적으로 옹근수파라메터 
ierr 를 가전다 . 이것은 C 에서 MPI 함수들의 귀환값과 같은 의미를 가전다 . 

포트란에서 MPI 함수들은 부분루린이며 call 명령을 리용하여 호출할수 
있다 . 모든 MPI 객체들(실례로 MPI_Datatype, MPI_Comm ) 은 포트란에서 
INTEGER 형 이 다 . 


제 1 절 그룹과 그룹연산 

1. 그롭 

일부 응용프로그람들에서는 프로쎄스들을 독립적인 작업을 하도록 
프로쎄 스그룹으로 분할하는것 이 편 리 하다 . 

례를 들면 행렬계산에서 방송(하나를 전체에 전송)조작에 의하여 행렬 
의 대각선에 따르는 프로쎄스들에게만 통보를 전달할 필요가 있다면 이 
대각선프로쎄스들을 하나의 그룹으로 묶어 이 그룹만이 통신조작에 참가 
하도록 하면 속도가 훨씬 더 빨라전다 . 

MPI 프로쎄 스들은 실 행 독립인 대 상들이 며 그룹은 프로쎄 스식 별자 ( 번호 ) 
들의 모임이다 . 그룹에서 매개 프로쎄스는 번호로 표시한다 . 그룹에서 
프로쎄스번호는 0 부터 시작하여 그 그룹에 속한 프로쎄스개수에서 1 을 
덜어낸 수값까지의 순서붙은 옹근수이다 . 그룹에 한하여 임의의 복잡도를 
가진 프로쎄스들사이의 련관구역을 구축할수 있는 모임론적인 그룹연산들 
이 MPI 에 정의되 여있다 . 

기정그룹인 MPI_GROUP_EMPTY 는 성원이 전혀 없는 빈 그룹이다 . 



2. 기본함수들 


- MPI_Group_size 
그룹의 크기를 되돌린다 . 

문법 

#include ” mpi.h” 

int MPI_Group_size( MPI_Group group, int *size ) 

입구파라메터 

group : 그룹 ( 손잡이 ) 

줄구파라메 터 

size : 그룹내 에 있는 프로쎄스개수 

- MPI_Group_rank 

주어진 그룹에서 자기 프로쎄스의 번호를 돌려 준다 . 

문법 

#include ” mpi.h” 

int MPI_Group_rank( MPI_Group group, int *rank ) 

입구파라메터 
group : 그룹 ( 손잡이 ) 

줄구파라메 터 

rank : 그룹에서 호출한 프로쎄스의 번호 ( 옹근수 ) 또는 이 프로쎄스가 
성원이 아니면 상수값인 MPI_UNDEFINED 


- MPI_Group_translate_ranks 

서로 다른 그룹중 한개 그룹에서의 프로쎄스번호를 다른 그룹에서의 
프로쎄스번호로 변환한다 . 

문법 

#include ” mpi.h” 

int MPI_Group_translate_ranks( MPI_Group group_a, int n, int 


*ranks_a, MPI_Group group_b, int *ranks_b ) 


입 구파라메 터 


group_a 

그룹 1( 손잡이 ) 


n 

ranks_a4 ranks_b 배렬들에서 

번호개수 ( 옹근수 ) 

ranks_a 

group_a 에서 0 또는 그 이상의 

유효한 번호배렬 

group_b 

그룹 2( 손잡이 ) 



줄구파라메 터 

ranks_b : group_b 에서 대응하는 번호들의 배렬， 일치한 번호의 
배렬이 존재하지 않을 때 MPI_UNDEFINED 값이다 . 


[실 례 1.1] groupl 이 그룹 {a, b, c, d, e, f} -2] 이 름이 고 group2 가 그룹 
{d, e, a, c} 의 이 름이 라고 하자 . ranks_a= {0, 5, 0, 2} 이 라고 하자 . 그러 면 
MPI_Group_translate_ranks 률 호출하면 group2 에 프로쎄스모임 {a, f, a, 
이 를 주며 ranks_b={2, ?, 2, 3} 이 될 것 이 다 . 

여기에서 ?은 MPI_UNDEFINED 값이다 . 


- MPI_Group_compare 
두 그룹을 비 교한다 . 

문법 

#include "mpi.h" 

int MPI_Group_compare(MPI_Group groupl, MPI_Group group2, 

int ^result ) 

입 구파라메 터 

groupl 그룹 1( 손잡이 ) 
group2 그룹 2( 손잡이 ) 

줄구파라메 터 

result ： 두 그룹의 순서와 성원들이 같으면 MPI_IDENT 인 옹근수，성원 
들만 같으면 MPI_SIMILAR, 그 외에는 MPI_UNEQUAL 인 옹근수값 


3. 그룹구축자와 그룹연산 


여러가지 그룹연산들을 리용하여 이미 존재하는 그룹들로부터 새로운 
그룹을 구축할수 있으며 이때 그룹구축자를 리용한다 . MPI 는 시작초기부터 
그룹을 구축하도록 하는 기능을 제공하지 않으며 구축은 다만 미리 정의 
되 여있는 그룹으로부터만 가능하다 . 이 기 정 그룹은 기 정 통신기 MPI_ 
COMM_WORLD 로부터 만들수 있다 . 

- MPI_Group_intersection 

현존 두개 그룹의 사귐부분으로 새 그룹으로 창조한다 . 

문법 

#include "mpi.h" 

int MPI_Group_intersection( MPI_Group group 1 ， MPI_Group 

group2, MPI_Group *newgroup ) 


입 구파라메 터 

group 1 그룹 1( 손잡이 ) 
group2 그룹 2( 손잡이 ) 

줄구파라메 터 

newgroup : 공통부분그룹 ( 손잡이 ) 

- MPI_Group_difference 
두개 그룹의 자로부터 새 그룹을 만든다 . 

문법 

#include "mpi.h" 

int MPI_Group_difference( MPI_Group groupl, MPI_Group 

group2, MPI_Group *newgroup ) 

입 구파라메 터 

group 1 첫째 그룹 ( 손잡이 ) 
group2 둘째 그룹 ( 손잡이 ) 


줄구파라메 터 

newgroup : 새 그룹 ( 손잡이 ) 

- MPI_Group_union 

두 그룹을 결합하여 새 그룹을 창조한다 . 

문법 

#include ” mpi.h” 

int MPI_Group_union( MPI_Group group 1, MPI_Group 

group2, MPI_Group *newgroup ) 


입구파라메터 

group 1 첫째 그룹 ( 손잡이 ) 
group2 둘째 그룹 ( 손잡이 ) 

줄구파라메 터 

newgroup : 합쳐진 그룹 ( 손잡이 ) 

[실례 1.2.] groupl= {a, b, c, d) 이고 group2= {d, a, e} 일때 


groupl U group2= 

{a, b, c, d, e} 

( 합 ) 

groupl fl group2= 

{a, d} 

( 적 ) 

groupl \ group2 = 

{ b , c } 

( 차 ) 


- MPI_Group_excl 

현재 그룹에서 지정된 성원들을 배제하고 재순서화하여 새로운 그룹을 
창조한다 . 

문법 

#include ’’mpi.h” 

int MPI_Group_excl( MPI_Group group, int n, int *ranks, 

MPI_Group *newgroup ) 


입구파라메터 
group 그룹 


n ranks 배렬에서의 원소개수 ( 옹근수 ) 

ranks newgroup 에 들어가지 않는 group 에서의 번호들의 
배렬 

줄구파라메 터 

newgroup ： 생성된 새로운 그룹，그룹 group 에서의 순서를 보존한다 . 

[실례 1.3] group= {a, b, c, d, e, f} 이고 ranks = {3,1,2} 이면 
newgroup 은 {a, e, f} 로 된다 . 


- MPI_Group_incl 

그룹 group 의 프로쎄스들중에서 번호가 rank[0] , rank[l], … rank[n- 
1] 인 n 개 프로쎄 스들만으로 이 루어 지 는 새 로운 그룹 newgroup 을 창조 
한다 . newgroup 에서 i 번째 프로쎄스는 group 에서 rank[i] 번째 프로쎄스 
이다 . 


문법 

#include ’’mpi.h” 

int MPI_Group_incl(MPI_Group group, int n, int *ranks, 

MPI_Group *newgroup ) 


입구파라메터 
group 그룹 

n ranks 배렬에서의 요소개수 (newgroup 의 크기 )( 옹근수 ) 
ranks newgroup 으로 넘어 가는 프로쎄 스들의 번호배 렬(옹근수배 렬 ) 


줄구파라메 터 

newgroup : 순서 가 ranks 에서 의 순서 대 로 되 여 있는 새 로운 그룹 
[실례 1.4] groups {a, b, c, d, e, f} 이 고 rank= {3, 1, 2} 이 라면 
newgroup= {d, b, c} 이 다 . 


- MPI_Group_range_excl 

현존 그룹으로부터 지정된 범위의 프로쎄스들을 제외하여 새로운 그룹을 
창조한다 . 

문법 

#include "mpi.h" 

int MPI_Group_range_excl(MPI_Group group, int n, int 

ranges[] [3], MPI_Group *newgroup ) 


입구파라메터 

group 그룹 ( 손잡이 ) 

n 배렬 ranks 에서의 항목수 ( 옹근수 ) 

ranges 3 옹근수조(첫번째 번호，마지막 번호，걸음)의 1 차원 배렬로 
서 출구그룹 newgroup 에서 제외되는 번호들을 지정한다 . 


줄구파라메 터 

newgroup ： 그룹 group 에서 순서를 보존하고있는 새로운 그룹 

[실 례 1.5] group: {a, b, c, d, e, f, g ,h, i, j} 

ranges: { (6, 7, 1) , (1, 6, 2), (0, 9, 4) } 의 값들로 이 
함수를 호출하면 3 옹근수조목록에 없는 원소값들로 이루어진 
새 로운 그룹 newgroup^ {c, j} 률 준다 . 

- MPI_Group_range_incl 

현존 그룹에서 지정된 범위의 번호들로 새로운 그룹을 창조한다 . 

문법 

#include "mpi.h" 

int MPI_Group_range_incl( MPI_Group group, int n, int 

ranges [] [3], MPI_Group ^newgroup ) 


입 구파라메 터 

group 그룹 ( 손잡이 ) 


n 배렬에서의 3 쌍의 개수 ( 옹근수 ) 

ranges 3 옹근수조(첫번째 번호，마지막 번호，걸음)의 1 차원 배별로서 
출구그룹 newgroup 에 포함되는 번호들을 지정한다 . 

줄구파라메 터 

newgroup : ranges 에 정의된 순서를 가진 새로운 그룹 

[실 례 1.6] group: {a, b, c, d, e, f, g ,h, i, j} ， 
ranges 니 (6, 7 , 1) , (1, 6, 2), (0, 9, 4)} 이 라고 하면 첫 3 옹근수조 (6, 7 , 
1 ) 은 번호 (6, 7 ) 인 프로쎄스 {g, 비를 결정하며 둘째 3 쌍 (1 ， 6 ， 2 ) 는 
번호가 (1 ， 3, 5 ) 인 프로쎄 스 {b, d, f} 들을 결정 하며 세 번째 3 쌍 (0, 9, 4 ) 는 
번 호가 (0, 4, 8) 인 프로쎄 스 {a, e, i} 를 결 정 한다 . 

결국 이 함수는 새 그룹 newgroup={g, h, b, d, f, a, e, 나 를 구축한다 . 

- MPI_Group_free 
그룹을 해 방한다 . 


문법 

#include "mpi.h" 

int MPI_Group_free( MPI_Group *group ) 

입 구파라메 터 
group : 그룹 ( 손잡이 ) 


제 2 절 통신기 

1. 통신기의 개념과 기초함수들 

MPI 프로쎄스들사이의 진행되는 모든 점대점 및 집합통신들은 반드시 
통신기라고 하는 기구를 통하여 수행된다 . 통신기는 그 자체를 생성하고 
리용하며 파피하는 간단한 규칙들과 속성들을 가진 객체이다 . 통신기에 
의하여 프로쎄스들사이의 점대점 및 집합통신에 리용되는 통신범위가 결정 
된다 . 


MPI 에서 진행되는 모든 통신이 반드시 모든 프로쎄스들사이에 이루어 
지 는것 은 아니 다 . MPI 프로그람작성 자는 자기 의 병 렬 알고리 듬의 특성 에 
따라서 일부 프로쎄스들사이에만 통신하여야 할 필요가 제기될수도 있다 . 
즉 통신시간을 최대로 줄이고 병렬처리의 효과성을 높이기 위하여 각이한 
프로쎄스그룹들로 구성되는 여러가지 통신기를 창조하고 리용할수 있다 . 
프로쎄스들을 여러 그룹으로 분할하는것은 통보전달의 안정성을 높여준다 
는 우점도 가전다 . 

MPI 에는 두가지 형태의 통신기 ( 내부통신기，외부통신기)가 있다 . 
내부통신기 는 개 별적 인 프로쎄 스그룹내의 통신에 리 용되는 통신기 이 다 . 
이려한 통신기우에서 진행되는 통신을 내부그룹통신이라고 한다 . 

외부통신기는 사귀지 않는 두 프로쎄스그룹사이의 점대점통신에 리용 
된다 . 이 통신을 외부그룹통신이라고 한다 . 

통신기와 관련되는 함수들은 다음과 같다 . 

- MPI_Comm_size 

통신기와 련관되는 그룹의 크기를 결정한다 . 

문법 

#include "mpi.h" 

int MPI_Comm_size( MPI_Comm comm, int *size ) 

입구파라메 터 : 
comm ： 통신기 ( 손잡이 ) 

줄구파라메 터 

size : 통신기의 그룹에서 프로쎄스개수 ( 옹근수 ) 

- MPI_Comm_rank 

통신기에서 호출하는 프로쎄스의 번호를 결정한다 . 

문법 

#include "mpi.h" 

int MPI_Comm_rank( MPI_Comm comm, int *rank ) 


입 구파라메 터 
comm: 통신기 ( 손잡이 ) 

줄구파라메 터 

rank : 통신기의 그룹에서 호출하는 프로쎄스의 번호 ( 옹근수 ) 

- MPI_Comm_compare 
두 통신기를 비교한다 . 

문법 

#include "mpi.h" 

int MPI_Comm_compare( MPI_Comm comml, 

MPI_Comm comm2, int ^result) 

입구파라메터 
comml 통신기 1 
comm2 통신기 2 

출구파라메터 : result 

만일 문맥과 그룹이 갈으면 MPIJDENT, 서로 다른 문맥과 동일한 
그룹이면 MPI_CONGRUENT, 서로 다른 문맥이지만 류사한 그룹이면 
MPI_SIMILAR, 나머지 경우 MPI_UNEQUAL 인 옹근수이다 . 

2. 동신기구죽자 

- MPI_Comm_dup 

모든 캐쉬정보와 함께 현존 통신기를 복제한다 . 

문법 

#include "mpi.h" 

int MPI_Comm_dup(MPI_Comm comm, MPI_Comm *newcomm ) 

입 구파라메 터 
comm: 통신기 ( 손잡이 ) 


줄구파라메 터 

newcomm * 새로운 문맥을 가지지만 comm 과 같은 그룹에 있는 새 
로운 통신기 

설명 

이 루틴은 새로운 문맥을 가진 새로운 통신기를 창조하며 입구통신기와 
꼭같은 프로쎄스그룹을 포함한다 . 

- MPI_Comm_create 

새로운 통신기를 창조한다 . 

문법 

#include ” mpi.h” 

int MPI_Comm_create( MPI_Comm comm, MPI_Group group, 

MPI_Comm *newcomm ) 

입구파라메터 

comm 통신기 

group 통신기 comm 의 그룹에서 부분그룹 ( 손잡이 ) 

줄구파라메 터 

newcomm : 새로운 통신기 ( 손잡이 ) 

- MPI_Comm_split 

색과 열쇠에 기초하여 새로운 통신기를 창조한다 . 

문법 

#include ” mpi.h” 

int MPI_Comm_split(MPI_Comm comm, int color, int key, 

MPI_Comm *newcomm ) 

입구파라메터 

comm 통신기 ( 손잡이 ) 


color 부분모임의 할당을 조절(부아닌 옹근수 ) 
key 프로쎄스번호할당을 조절 ( 옹근수 ) 


줄구파라메 터 

newcomm: 새로운 통신기 ( 손잡이 ) 


설명 

color 는 MPI_UNDEFINED 또는 부아닌 옹근수이 여 야 한다 . 


[실례 1.7] 아래의 값들을 가진 파라메터들로 함수 MPI_Comm_split 를 
호출한다고 하자 . 


rank 0 1 

process a b 
color 0 x 
key 3 1 


2 3 4 5 
c d e f 

3 0 3 0 

2 5 11 


6 7 8 9 
g h i j 
0 5 3 x 
12 10 


함수는 새 로운 통신 기 들인 그룹 l={f, g, a, d}, 그룹 2 - {e, i, c}, 
그룹 3= {비들을 생성하며 프로쎄스 b 와 j 는 그룹이름이 정확치 못하므로 
(색갈이 표로서 없음 ) 여기에 들어가지 못한다 . 


3. 통신기의 삭제 


- MPI_Comm_free 
지정된 동신 기 를 삭제 한다 . 

문법 

#include "mpi.h" 

int MPI_Comm_free( MPI_Comm *comm) 

입 구파라메 터 
comm : 통신기 ( 손잡이 ) 

이 함수는 이미 창조하였던 통신기가 더는 필요없을 때 사용한다 . 


4. 내부통신기의 보조함수들 


- MPI_Comm_get_name 
통신 기이 름을 돌려 준다 . 

문법 

#include "mpi.h" 

int MPI_Comm_get_name( MPI_Comm comm, char *namep, 

int *reslen ) 


입구파라메터 

comm : 이름을 얻으러는 통신기 ( 손잡이 ) 

줄구파라메 터 

namep : 적어도 MPI_MAX_NAME_STRING 크기 의 배렬 이여야 한다 . 
reslen : 통신 기 이 름의 문자개 수 


- MPI_Comm_group 

지정된 통신기와 관련된 그룹에 접근한다 . 


문법 

#include "mpi.h" 

int MPI_Comm_group( MPI_Comm comm, MPI_Group *group ) 

입 구파라메 터 
comm : 통신기 

줄구파라메 터 

group : 통신기 의 그룹 

- MPI_Comm_remote_group 

주어진 외부통신기와 관련되는 원격그룹에 접근한다 . 


문법 

#include "mpi.h" 

int MPI_Comm_remote_group( MPI_Comm comm, MPI_Group *group ) 

입 구파라메 터 

comm : 통신기(외부통신기이여야 한다 .) 

줄구파라메 터 

group : 통신기 의 원격 그룹 

- MPI_Comm_remote_size 

외부통신기와 관련되는 원격그룹의 크기를 결정한다 . 


문법 

#include "mpi.h" 

int MPI_Comm_remote_size( MPI_Comm comm, int *size) 

입 구파라메 터 

comm: 통신기 ( 손잡이 ) 

줄구파라메 터 

size : 통신기의 그룹에서 프로쎄스개수 ( 옹근수 ) 

- MPI_Comm_set_name 

통신기에 이름을 설정한다 . 

문법 

#include "mpi.h" 

int MPI_Comm_set_name( MPI_Comm comm, char *name ) 

입 구파라메 터 

comm : 이름을 설정하여 야 할 통신기 
name : 통신기 의 이름 


5. 외부통신기구축자 


내 부통신 기 는 MPI_Comm_dup 를 호출하여 생 성할수 있 다 . 외 부통신 기 
를 구축하기 위해 우선 이전의 그룹들과 꼭같은 그룹으로된 새로운 그룹간 
통신기를 생성하며 사용자가 정의한 속성들을 넣는다 . 외부통신기파괴는 
MPI_Comm_free 를 호출하여 진행한다 . 외부통신기와 관련되는 함수들은 
다음과 같다 . 

- MPI_Intercomm_create 

두개 의 내 부통신 기 들로부터 외 부통신 기 를 창조한다 . 


문법 

#include ” mpi.h” 

int MPI_Intercomm_create( MPI_Comm local_comm, int 

local_leader, MPI_Comm peer_comm, int remote_loader, 
int tag, MPI_Comm *newcomm ) 


입구파라메터 
local_comm 
local_leader 
peer_comm 
remote_leader 
tag 


국부 ( 내부)통신기 

국부그룹 local_comm 의 지휘프로쎄스번호(보통 0) 
원격 통신기 

peer_comm 에서 원격지휘프로쎄스번호(보통 0) 
통보표적 


줄구파라메 터 

newcomm : 창조된 외 부통신기 


- MPI_Intercomm_merge 

외 부통신 기 로부터 내 부통신 기 를 창조한다 . 


문법 

#include ” mpi.h” 

int MPI_Intercomm_merge( MPI_Comm comm, int high, 

MPI Comm *newcomm ) 


입 구파라메 터 

comm 외 부통신 기 

high 새로운 통신기를 창조할 때 comm 내에서 두개의 내부통신기들의 
그룹들을 순서 화하는데 리 용하는 값 

줄구파라메 터 

newcomm : 창조된 내부통신기 

- MPI_Comm_test_inter 
comm 이 외 부통신 기인 가를 검 사한다 . 

문법 

#include "mpi.h" 

int MPI_Comm_test_inter( MPI_Comm comm, int *flag ) 

입 구파라메 터 
comm: 통신기 ( 손잡이 ) 

줄구파라메 터 
flag : 기 발 ( 론리값 ) 

[실례 1. 8] 실례에서 프로쎄스들은 3 개의 그룹으로 나누어져있다 . 그룹 
0 과 1 이 련결되 여 있고 그룹 1 과 2 가 련결되 여 있다 . 결국 그룹 0 과 2 에 
는 한개씩의 내부통신기가 필요하지만 그룹 1 에는 2 개의 외부통신기가 
필요하다 . 

아래에서는 매 프로쎄스의 국부번호와 대역번호 ( 괄호안에)를 주고있다 . 
그룹 0 그룹 1 그룹 2 
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이것을 만드는 프로그람을 작성하기로 한다 . 

#include <stdio.h> 

#include “mpi.h” 

main(int argv, char **argc) 

{ 

MPI_Comm myComm ； /* 국부부분그룹의 내 부통신기 */ 

MPI_Comm myFirstComm ； /* 외 부통신기 */ 

MPI_Comm mySecondComm ； /* 두번째 외부통신기 */ 
int membershipKey, rank ； 

MPI_Init(&argc, &argv )； /* MPI 서 고초기 화 */ 

/* 자기의 번호를 결정 */ 
MPI_Comm_rank(MPLCOMM_WORLD, &rank )； 

/* membershipKey 에서 번호 [0, 1, 2] 발생 */ 
MembershipKey=rank%3 ； 

/* 국부부분그룹에 대 한 내부통신기 의 구축 */ 
MPI_Comm_split(MPI_COMM_WORLD, membershipKey, rank, 
&myComm )； 

/* 외 부통신 기 들의 구축 */ 
if (membershipKey == 0) { 

/* 그룹 0 이 그룹 1 과 련결 */ 

MPI_Intercomm_create(myComm, 0, MPI_COMM_WORLD, 1, 
01, &myFirstComm )； 

} 

else if (membershipKey == 1) { 

/* 그룹 0 과 그룹 1,2 가 련 결 */ 

MPI_Intercomm_create(myComm, 0, MPI_COMM_WORLD, 0, 
01, &myFirstComm )； 

MPI_Intercomm_create(myComm, 0, MPI_COMM_WORLD, 2, 
12, &mySecondComm )； 



else if (membershipKey == 2) { 

/* 그룹 2 와 그룹 1 이 련 결 */ 

MPI_Intercomm_create(myComm, 0, MPI_COMM_WORLD, 1, 
12, &myFirstComm )； 


j 건 : ***********5 유 * : 겨 1 • 스 > 부 - '■ 분 : jJcjfcjJcjfcjJcjJc^cjJc^cjfcjJcjJcjJcjfc^cjJc^cjJcjJcjJc^ 

/* 3 개 의 통신 기 삭제 */ 
MPI_Comm_free(&myComm )； 
MPI_Comm_free(&myFirstComm )； 
if (membershipKey == 1) 
MPI_Comm_free(&mySecondComm )； 
MPI_Finalize ()； 
return 0 ； 


제 3 절 가상위상 

i. 가상위상의 개념 

프로쎄 스들사이 의 통신 모형 을 그라프로 표시 할수 있다 . 그라프에 서 
마디는 프로쎄스를，변은 두개 프로쎄스사이의 호상통신을 표시한다 . 모든 
통신들은 거의 나 대칭 이므로 통신그라프는 대칭그라프이 다 . 

MPI 는 그룹에 있는 임의의 프로쎄스쌍사이의 통보전송을 보장한다 . 
프로그람에서 통보전송을 정점이 프로쎄스이고 그라프변이 통보인 
방향그라프로 표시할수 있다 . 

가상위상이란 고리，살창，별，나무 등 임의로 주어지는 그라프형태를 
프로그람적으로 실현한 위상이다 . 가상위상은 통신기와 련관된 프로쎄스 
들의 이름달기기구를 매우 편리하게 보장하며 프로쎄스들을 체계의 
장치에로 넘기는 강력한 수단이다 . MPI 에서 가상위상은 통신기에 련결된 
프로쎄스그룹에서만 제시할수 있다 . 



이미 지적한것처럼 프로쎄스그룹은 n 개 프로쎄스로 이루어진 조로서 
매 프로쎄스에는 0 〜 (n-1 ) 사이의 옹근수번호가 대응된다 . 

대 다수의 병 렬계산환경 들에서 선형 적 인 프로쎄스번호달기 는 프로쎄 스 
들사이의 론리적 인 통신모형을 민감하게 반영하지 못한다 . 

병렬알고리듬들은 보통 2 차원 혹은 체적살창형태의 위상모형으로 표 
현되며 일반적으로 프로쎄스들의 론리적인 배치는 임의의 그라프로 표시 
되여야 한다 . 

프로쎄스들의 가상위상과 물리적장치의 위상을 구분하여 야 한다 . 

가상위상기구는 병렬프로그람의 서술을 현저하게 단순화하고 쉽게 
하며 프로그람을 리해하기 쉽게 한다 . 

사용자는 처 리기들의 물리적련관도식 이 아니 라 프로쎄스들의 가상위상 
만을 서술하면 될것이다 . 

2. 데카르트위상함수들 

2.1 데카르트위상구축함수 

- MPI_Cart_create 

데 카르트위 상정 보가 첨 부되 는 새 로운 통신 기 률 창조한다 . 

문법 

#include "mpi.h" 

int MPI_Cart_create( MPI_Comm comm_old, int ndims, int 

*dims, int ^periods, int reorder, MPI_Comm *comm_cart ) 

입 구파라메 터 

comm_old - 입구통신기 

ndims - 데카르트살창의 차원수 

dims - 매 차원에 있는 모든 프로쎄스개수를 지정하는 

ndims 크기 의 옹근수배 렬 

periods - 매 차원에서 살창이 주기적 인가 ( 참 ) 아닌가 ( 거짓)를 
지정하는 ndims 크기의 론리값배 렬 

reorder - 프로쎄스번호달기가 재순서화되는가 ( 참 ) 아닌가 ( 거짓)률 
지정 (론리 값 ) 


줄구파라메 터 

comm_cart - 데카르트위상을 가지는 새로운 통신기 
2.2 데 카르트살창제 시 함수 


- MPI_Dims_create 

데 카르트살창에서 처 리 기들의 분할을 진행 한다 . 

문법 

#include "mpi.h" 

int MPI_Dims_create( int nnodes, int ndims, int *dims) 

입 구파라메 터 

nnodes 살창에 있는 마디 점 수 ( 옹근수 ) 
ndims 데카르트차원수 ( 옹근수 ) 

dims : 매 차원에서 마디 점 수를 지 정 하는 ndims 크기 의 옹근수배 렬 
줄구파라메 터 

dims : 매 차원 에 서 마디 점 수를 지 정 하는 ndims 크기 의 옹근수배 렬 
dims 는 입구인 동시에 출구로 된다 . 


[실례 2.1] MPI_Dims_create 함수를 호출한 실례들 


호출전 dims 호출 

(0, 0) MPI_Dims_create(6, 2, dims) 

(0, 0) MPI_Dims_create(7, 2, dims) 

(0, 3, 0) MPI_Dims_create(6, 3, dims) 
(0, 3, 0) MPI_Dims_create(7, 3, dims) 


호출후의 dims 
(3, 2) 

(7, 1) 

(2, 3, 1) 

입 구값오유 


2.3 데카르트정보함수들 


- MPI_Cartdim_get 

통신기와 련관되는 데카르트위상의 차원수를 돌려준다 . 


문법 

#include "mpi.h" 

int MPI_Cartdim_get( MPI_Comm comm, int *ndims ) 

입 구파라메 터 

comm ： 데카르트구조률 가진 통신기 
줄구파라메 터 

ndims : 데 카르트구조의 차원수 ( 옹근수 ) 

- MPI_Cart_get 

통신 기 와 관련 한 데 카르트위 상정 보를 돌려 준다 . 

문법 

#include "mpi.h" 

int MPI_Cart_get(MPI_Comm comm, int maxdims, int *dims, 

int ^periods, int *coords ) 

입 구파라메 터 

comm - 데 카르트구조률 가진 통신기 

maxdims - 호출하는 프로그람에서 dims, periods, coords 배렬들의 
최대 길이 

줄구파라메 터 

dims - 매개 데카르트차원에 있는 프로쎄스개수 ( 옹근수배렬 ) 
periods - 매 자리 표에서 주기성 (true/false ) 을 지정 하는 값배렬 
coords - 데카르트구조에서 호출하는 프로쎄스의 자리표 

2.4 데카르트변환함수 

- MPI_Cart_rank 

지정된 데카르트자리표에 있는 프로쎄스의 번호률 결정한다 . 


문법 

#include "mpi.h" 

int MPI_Cart_rank(MPI_Comm comm, int *coords, int *rank ) 

입 구파라메 터 

comm 데카르트구조의 통신기 

coords 옹근수배렬 (크기 는 ndims ) 로서 프로쎄 스의 데 카르트자리 표를 
지 정 한다 . 

줄구파라메 터 

rank: 지정된 프로쎄스의 번호 ( 옹근수 ) 

- MPI_Cart_coords 

그룹안에서 지 정된 처 리 기의 데카르트위상자리 표를 결정 한다 . 


문법 

#include "mpi.h" 

int MPI_Cart_coords( MPI_Comm comm, int rank, int maxdims, 

int *coords ) 


입 구파라메 터 

comm - 데 카르트구조를 가진 통신기 

rank - comm 의 그룹내부에서 프로쎄스의 번호 

maxdims - 호출하는 프로그람에서 dims, periods, coords 의 최대길이 

줄구파라메 터 

coords - 지정된 프로쎄스의 데카르트자리표률 포함하는 ndims 크기의 
옹근수배 렬 

2.5 데카르트밀기，분할 , 넘기기함수 
- MPI_Cart_shift 

밀기방향과 거 리가 주어지면 밀기된 원천과 목적번호들을 돌려준다 . 


문법 

#include ” mpi.h” 

int MPI_Cart_shift( MPI_Comm comm, int direction, int displ, 

int *source, int *dest ) 


입구파라메터 

comm 데카르트구조의 통신기 
direction 밀기할 자리 표차원 ( 옹근수 ) 

displ 변위방향 0 0 ： 우로 밀기， <0: 아래로 밀기 ) ( 옹근수 ) 

줄구파라메 터 

source 원천프로쎄스의 번호 ( 옹근수 ) 

dest 목적프로쎄스의 번호 ( 옹근수 ) 

- MPI_Cart_sub 

더 낮은 차원의 데카르트부분살창을 이루는 부분그룹들로 통신기를 
분할한다 . 

문법 

#include ” mpi.h” 

int MPI_Cart_sub( MPI_Comm comm, int *remain_dims, 

MPI_Comm *comm_new ) 


입구파라메터 

comm 데카르트구조의 통신기 

remain_dims remain_dims 의 i 번째 요소는 i 번째 차원이 부분살창에 
들어 가는가 ( 참)，들어 가지 않는가(거 짓 )를 결 정한다 . 


줄구파라메 터 

comm_new : 호출프로쎄스를 포함하는 부분살창에 해 당한 통신기 

[실례 2.2] MPI_Cart_create (… ， comm ) 이 (2*3* 4 ) 살창을 창조하였다고 
하자 . remain_dims=(true, false, true) 값으로 MPI_Cart_sub(comm, 
remain_dims, comm_new ) 를 호출하면 3 개 의 통신 기 가 생성되며 매 개 


통신기에 데카르트위상이 2*4 인 8개의 프로쎄스들이 들어간다. 

만일 remain _ dims =( false , false , true ) 로 함수를 호출하면 한개 차원의 
데카르트살창에 4 개의 프로쎄스들을 가지는 사귀지 않는 6 개의 통신기가 
생성된다. 

- MPI _ Cart_map 

프로쎄 스를 데 카르트위 상에 로 넘 긴 다. 

문법 

#include " mpi . h " 

int MPI _ Cart _ map ( MPI_Comm comm , int ndims , int * dims , 
int ^ periods , int * newrank ) 


입 구파라메 터 

comm 입구통신기 

ndims 데카르트구조의 차원수(옹근수) 

dims 매 자리표방향에서의 프로쎄스개수를 지정하는 ndims 크기의 
옹근수배 렬 

periods 매 자리 표방향에서의 주기성을 지 정 하는 ndims 크기의 론리 배 렬 
줄구파라메 터 

newrank : 재순서화된 호출프로쎄스의 번호，호출프로쎄스가 살창에 
속하지 않으면 MPI _ UNDEFINED 의 옹근수값 


3. 그라프위상함수들 

여 기서는 그라프위 상구조와 관련되 는 MPI 함수들을 서 술한다. 
3.1 그라 프 구축함 수와 그라 프 요구함 수들 
- MPI _ Graph_create 

그라프위상정보가 첨부되는 새로운 통신기를 만든다. 


문법 


#include " mpi . h " 

int MPI _ Graph _ create ( MPI_Comm comm _ old , int nnodes , int 
* index , int hedges , int reorder , MPI_Comm * comm_graph ) 


입 구파라메 터 

comm_old 위상이 없는 입구통신기 
nnodes 그라프에서의 마디 수(옹근수) 

index 마디점의 준위들을 서술하는 옹근수배렬 
edges 그라프변들을 서술하는 옹근수배렬 

reorder 번호재순서화를 하는가(참)，안하는가(거짓)를 지정 
(론리 값) 


줄구파라메 터 

comm_graph : 그라프위상이 첨부된 새로운 통신기 
[실례 2.3] 린접행 렬이 다음과 같은 4 개의 프로쎄스 0, 1，2, 3 이 있다고 


하자. 

프로쎄스 린접 

0 1，3 

1 0 

2 3 

3 0, 2 


이때 입구파라메터들은 다음과 같이 결정한다. 
nnodes =4 
index =(2, 3，4， 6) 
edges =( l ， 3, 0, 3, 0, 2) 


- MPI _ Graphdims_get 
통신기와 련관된 그라프위상정보를 준다. 

문법 

#include " mpi . h " 

int MPI _ Graphdims _ get ( MPI_Comm comm , int * nnodes , int 


*nedges ) 


입 구파라메 터 

comm : 그라프구조의 그룹을 가진 통신기 
줄구파라메 터 

nnodes 그라프의 마디 점 수 ( 옹근수 ) 
nedges 그라프의 변개수 ( 옹근수 ) 

- MPI_Graph_get 

통신기와 련관된 그라프위상정보률 준다 . 

문법 

#include "mpi.h" 

int MPI_Graph_get( MPI_Comm comm, int maxindex, int 

maxedges, int *index, int hedges ) 


입 구파라메 터 

comm 그라프구조를 가진 통신기 

maxindex 호출프로그람에서 의 벡토르 index 의 길이 ( 옹근수 ) 
maxedges 호출프로그람에서 의 벡토르 edges 의 길 이 ( 옹근수 ) 


줄구파라메 터 

index 그라프구조를 담은 옹근수배 렬 (MPI_Graph_create 참고할것 ) 
edges 그라프구조를 담은 옹근수배 렬 

3.2 그라프넘기기함수와 위상요구함수 

- MPI_Graph_map 

프로쎄 스률 그라프위 상정 보에 로 넘 긴 다 . 

문법 

#include "mpi.h" 

int MPI_Graph_map(MPI_Comm comm, int nnodes, int 


*index, int hedges, int *newrank ) 


입 구파라메 터 

comm 입구통신기 

nnodes 그라프마디개수 ( 옹근수 ) 

index 그라프구조를 지정 하는 옹근수배 렬 (MPI_Graph_create 

함수를 참고할것 ) 

edges 그라프구조를 지정하는 옹근수배렬 

줄구파라메 터 

newrank : 재순서화된 호출프로쎄스의 번호，호출프로쎄스가 그라프에 
속하지 않으면 MPI_UNDEFINED 인 옹근수값 

- MPI_Topo_test 

통신기와 련관된 위상형을 검사한다 . 

문법 

#include "mpi.h" 

int MPI_Topo_test( MPI_Comm comm, int *top_type ) 

입 구파라메 터 
comm : 통신기 

줄구파라메 터 

top_type : 통신기 comm 의 위상형 
다음의 3 개 값들중의 하나를 준다 . 

MPI_GRAPH : 그라프위상 
MPI_CART : 데 카르트위 상 
MPI_UNDEFINED : 위상이 없음 

3.3 그라프정보함수들 

- MPI_Graph_neighbors_count 

그라프위상을 따르는 마디의 린접들의 개수를 돌려준다 . 


문법 

#include ” mpi.h” 

int MPI_Graph_neighbors_count( MPI_Comm comm, int rank, 
int *nneighbors ) 


입구파라메터 

comm 그라프위상을 가진 통신기 

rank 그룹 comm 에서 프로쎄스의 번호 ( 옹근수 ) 

줄구파라메 터 

nneighbors : 지정된 프로쎄스의 린접개수 ( 옹근수 ) 

- MPI_Graph_neighbors 
그라프위상을 따르는 마디의 린접들을 돌려준다 . 

문법 

#include ” mpi.h” 

int MPI_Graph_neighbors( MPI_Comm comm, int rank, int 

maxneighbors, int .neighbors ) 


입구파라메터 

comm 그라프위상을 가진 통신기 ( 손잡이 ) 

rank 그룹 comm 에서의 프로쎄스의 번호 ( 옹근수 ) 

maxneighbors 배 렬 neighbors 의 길 이 ( 옹근수 ) 

줄구파라메 터 

neighbors: 주어진 프로쎄스의 린접프로쎄스들의 번호 ( 옹근수배렬 ) 


제 4 절 점대점 (point-to-point ) 연산 


MPI 에 서 프로쎄 스들사이 의 기 본통신 기 구는 호상작용하는 프로쎄 스쌍들 


사이의 자료전송으로서 하나는 송신프로쎄스이고 다른 하나는 수신프로 
쎄스이 다. 이 통신을 점 대점 ( point - to - point ) 연산이 라고 한다. 

MPI 의 거의 모든 연산들은 이 점대점연산에 기초하여 구축되 였다. 

MPI 는 표적 ( tag ) 이 붙은 자료형 ( datatype ) 을 전송하도록 하는 여러가지 
송수신함수들을 제공한다. 

MPI 에는 점대점연산을 수행하는 여 러가지 함수들이 있다. 

기초적인 점대점송신 및 수신연산에는 차단연산과 비차단연산이 있다. 
또한 송신 연산에 는 완충형，동기형，준비 상태 형 이 있다. 수신 연산에 는 
차단과 비차단 두가지이며 이 매개 수신연산은 모든 송신연산과 서로 
대 응된 다. 


1. 차단통신 
1.1 차단자료전송 

차단전송함수들은 비동기형으로서 파라메터전송후에 체계에 조종을 
넘기며 수신측에서 통보를 받았는가 받지못하였는가는 송신측에서 고려 
하지 않는다. 송신측에서 전송함수호출후에 전송할 자료렬에 대한 접근 
(읽기 혹은 쓰기)이 있을 때 통보자료들이 체계의 중간완충기에 안전하게 
보관될 때까지 즉 송신완충기에 다시 접근(읽기 혹은 쓰기)가능할 때까지 
는 그 접근이 차단된다. 

수신측에서는 이 경우에 어떤 예견도 없으며 송신측에서는 대응하는 
수신함수가 시동되 였는가에 무관계하게 송신을 끝낸다. 

응용프로그람에서는 전송자료률 체계완충기 에 보관하도록하는 그 어떤 
서술도 필요없으며 전송자료들은 체계에 의하여 체계완충기에 완충된다. 

차단전 송함수들로는 표준전 송함수 ( MPI _ Send ), 완충전 송함수 ( MPI_Bse 
nd ), 동기 전송함수 ( MPI _ Ssend ) 및 준비 전송함수 ( MPI _ Rsend ) 들이 있다. 


- MPI_Send 

기본송신을 진행한다. 


문법 

#include " mpi . h " 

int MPI _ Send ( void * buf , int count , MPI_Datatype datatype , 

int dest , int tag , MPI_Comm comm ) 


입 구파라메 터 

buf 송신완충기의 시작주소 

count 송신완충기의 요소수(부아닌 옹근수) 

datatype 매 송신완충기 요소의 자료형 (손잡이) 

dest 목적 프로쎄스번호(옹근수) 

tag 통보표적(옹근수) 

comm 통신기 


- MPI_Bsend 

사용자가 정의한 완충에 의한 기본전송함수이다. 

문법 

#include " mpi . h " 

int MPI _ Bsend(void * buf , int count , MPI_Datatype datatype , int 



dest , int tag , MPI_Comm 

입 구파라메 터 

buf - 

송신완충기의 시작주소 

count - 

■ 송신완충기에서 요소의 수 

datatype - 

매 송신완충기요소의 자료형 

dest - 

목적프로쎄스번호 

tag - 

통보표적 

comm - 

통신기 


설명 

이 전송은 사용자가 송신통보가 어디에 완충될것인가를 고려하지 않고 
도 통보를 전송하는데 편리하다. 사용자가 MPI_Bu 打 er_attach 함수를 리용 
하여 완충기공간을 제공한다. 

C 에서는 

MPI _ Buffer _ detach (& b , & n )； 

포트란에서는 
MPI _ Buffer _ attach ( b , n )； 

에 의하여 통보가 배정될수 있다. 


- MPI_Ssend 

기 본동기 전 송함수이 다. 

문법 

#include " mpi . h " 

int MPI _ Ssend ( void * buf，int count , MPI_Datatype datatype , 
int dest , int tag , MPI_Comm comm ) 


입 구파라메 터 

buf 송신완충기의 시작주소 

count 송신완충기의 요소수(부아닌 옹근수) 

datatype 매 송신완충기 요소의 자료형 (손잡이) 

dest 목적프로쎄스번호 

tag 통보표적 

comm 통신기 

- MPI_Rsend 
기 본기 다림 전 송함수이 다. 

문법 

#include " mpi . h " 

int MPI _ Rsend ( void * buf , int count , MPI_Datatype datatype , 

int dest , int tag , MPI_Comm comm ) 

입 구파라메 터 

buf 송신완충기의 초기주소 

count 송신완충기의 요소수(부아닌 옹근수) 

datatype 매 송신완충기 요소의 자료형 (손잡이 ) 

dest 목적프로쎄스번호 

tag 통보표적 

comm 통신기 


1.2 차단수신 


자료차단수신 함수 ( MPI _ Recv ) 는 수신 자료완충기 가 대 응하는 통보를 
얻은 후에만 조종을 되돌린다. 

- MPI_Recv 
기 본수신 함수이 다. 

문법 

#include " mpi . h " 

int MPI _ Recv ( void * buf , int count , MPI_Datatype datatype , 
int source , int tag , MPI_Comm comm , MPI_Status ^status ) 

줄구파라메 터 

buf 수신완충기의 시작주소 
status 수신 상태 정 보 

입 구파라메 터 

count 수신해야 할 요소개수(옹근수) 
datatype 매 수신완충기 요소의 자료형 (손잡이 ) 
source 송신(원천)프로쎄스번호(옹근수) 
tag 통보표적(옹근수) 
comm 통신기 

프로쎄스들사이의 송수신을 진행함에 있어서 지켜야 할 문제들을 실례 
를 통하여 보기로 한다. 

아래의 두 실례들은 송신측과 수신측의 자료형들이 일치하여야 한다 
는것을 보여주고있다. 

[실례 4.1] 송신측 및 수신측에 대한 프로그람부분을 보기로 하자. 


MPI _ Comm _ rank ( comm , & rank )； 
if (rank == 0) 


MPI _ Send ( a , 10, MPI _ FLOAT , 1, tag , comm )； 
else if (rank == 1) 

MPI _ Recv ( b , 10, MPI _ FLOAT , 0, tag , comm , status )； 


이 코드에서 a 와 b 가 10 차이상의 류점수배렬이면 오유가 없는것으로 
된다. 만일 송수신함수들에서 송수신자료형을 나타내는 3 번째 파라메터가 
류점수가 아닌 다른 형，실례로 옹근수형이면 a , 느는 10 차이상의 옹근수 
배렬이여야 한다. 

[실례 4.2] 송신측과 수신측이 형대응을 틀리게 한 실례 

MPI _ Comm _ rank ( comm , & rank )； 
if (rank == 0) 

MPI _ Send ( a , 40, MPI 一 FLOAT , 1, tag , comm )； 
elseif (rank == 1) 

MPI _ Recv ( b , 40, MPI — BYTE , 0, tag , comm , status )； 


우에서 송신자료형은 MPI_FLOAT 이고 수신자료형은 MPI_BYTE 이므로 
오유이 다. 

다음 3 가지 실례프로그람들은 한 처리기에서 송신함수와 수신함수를 
동시에 호출하는 경우를 보여준다. 

[실례 4.3] 통보교환 

MPI _ Comm _ rank ( comm , & rank )； 
if (rank == 0) { 

MPI _ Send ( sendbuf , count , MPI _ FLOAT , 1, tag , comm )； 
MPI _ Recv ( recvbuf , count , MPI _ FLOAT , 1, tag , comm , & status )； 

} 

if (rank == 1) { 

MPI _ Recv ( recvbuf , count , MPI _ FLOAT , 0, tag , comm , & status )； 
MPI _ Send ( sendbuf , count , MPI _ FLOAT , 0, tag , comm )； 


이 프로그람은 완충기를 위한 기 억구역 이 확보되지 않은 경우에도 정확 
한 통신을 진행한다 . 

[실례 4.4] 통보교환 

MPI_Comm_rank(comm, &rank )； 
if (rank == 0) { 

MPI_Recv(recvbuf, count, MPI_FL0AT, 1, tag, comm, &status )； 
MPI_Send(sendbuf, count, MPI—FLOAT, 1, tag, comm )； 

} 

if (rank == 1) { 

MPI_Recv(recvbuf, count, MPI_FLOAT, 0, tag, comm, &status )； 
MPI_Send(sendbuf, count, MPI_FLOAT, 0, tag, comm )； 


0 번 프로쎄스의 수신함수는 1 번 프로쎄스로부터 우선 자료를 받고 
다음에 1 번 프로쎄스에 자료를 보내야 하며 오직 1 번 프로쎄스가 0 번 
프로쎄스에로의 자료전송을 완료한 후에야 완료할수 있다 . 1 번 프로쎄스에 
대해서도 마찬가지이며 결국 프로그람은 교착상태에 빠지게 된다 . 

[실례 4.5] 완충화를 예견한 통보교환 

MPI_Comm_rank(comm, &rank )； 
if (rank == 0) { 

MPI_Send(sendbuf, count, MPI_FLOAT, 1, tag, comm )； 
MPI_Recv(recvbuf, count, MPI_FLOAT, 1, tag, comm, &status )； 

} 

if (rank == 1) { 

MPI_Send(sendbuf, count, MPI_FLOAT, 0, tag, comm )； 
MPI_Recv(recvbuf, count, MPI_FLOAT, 0, tag, comm, &status )； 


매 프로쎄스에서 송신함수들이 완료하고 수신함수들이 시동하도록 송신 
통보를 어디엔가 복사하여야 한다. 프로그람을 안전하게 끝내기 위하여 
서는 적어도 두 통보중의 하나는 완충화되여있어야 한다. 

통신체계가 자기의 내부완충기에 통보를 완충만 한다면 제대로 돌아갈 
것이며 그렇지 않은 경우 교착상태에 빠진다. 결국 실행시에 완충기기억량 
에 의해 프로그람의 완료가 좌우된다. 자료량이 많지 않으면 프로그람은 
정확히 실행된다. 

2. 비 차단통신 

모든 비차단통신조작들은 통신요구를 체계에 제출하는 함수와 그 통신 
요구가 끝났는가를 응용프로그람이 검사하도록 하는 “완료검사” 함수 
두개로 항상 나누어져있다. 함수에서 앞불이 B , S , 요는 각각 완충형， 
동기형，준비 상태 형 전송함수라는것，그리 고 앞붙이 I 는 연산이 비 차단형 
이라는것을 가리킨다. 비차단수신함수는 MPI_Irecv 함수 하나뿐이며 이 
모든 비차단연산들은 완료기다림 및 검사함수에 의하여 끝난다. 

2.1 비차단자료전송 

비차단함수는 체계가 송신완충기에 대해서 자료를 복사할수 있게 되였 
다는것을 지적한다. 파라메터들을 체계에 전송한 후에 함수는 조종을 되돌 
린다. 그 다음에 전송프로쎄스는 송신완충기에 접근(읽기 또는 쓰기)하지 
말아야 한다. 접근하는 경우 체계는 전송자료의 타당성을 담보하지 않는다. 
고찰하는 연산의 완료를 기다리고 검사하기 위하여 MPI_Wait 함수와 
MPI _ Test 함수를 리용한다. 여기서 완료란 전송통보들이 체계의 중간완충 
기에 안전하게 들어가고 송신완충기가 접근가능하게 되였을 때이다. 

비 차단전 송함수들에 는 표준전 송함수 ( MPI _ Isend )， 완충전 송함수 ( MPI_Ib 
send ), 동기 전송함수 ( MPI _ Issend ) ，준비상태 따름전송함수 ( MPI _ Irsend ) 등 
이 있다. 


MPI_Isend 

비차단전송을 진행한다. 


문법 


#include " mpi . h " 

int MPI _ Isend ( void * buf , int count , MPI_Datatype datatype , 
int dest , int tag , MPI_Comm comm , MPI_Request ^request ) 

입 구파라메 터 

buf 송신완충기의 시작주소 

count 송신완충기의 요소수(옹근수) 

datatype 매 송신완충기 요소의 자료형 
dest 목적프로쎄스의 번호(옹근수) 

tag 통보표적(옹근수) 

comm 통신기(손잡이) 

줄구파라메 터 

request ： 통신요구(손잡이) 

- MPI_Ibsend 
비 차단완충전 송을 진 행 한다. 

문법 

#include " mpi . h " 

int MPI _ Ibsend ( void * buf , int count , MPI_Datatype datatype , int dest , 
int tag , MPI_Comm comm , MPI_Request ^request ) 

입구파라메터 

buf 송신완충기의 시작주소 

count 송신완충기의 요소수(옹근수) 

datatype 매 송신완충기 요소의 자료형 
dest 목적프로쎄스의 번호(옹근수) 

tag 통보표적(옹근수) 

comm 통신기(손잡이) 

줄구파라메 터 

request : 통신요구(손잡이) 


- MPI_Issend 

비 차단동기 전 송을 진 행 한다. 

문법 

#include " mpi . h " 

int MPI _ Issend ( void * buf , int count , MPI_Datatype datatype , int dest , 
int tag , MPI_Comm comm , MPI_Request ^request ) 

입 구파라메 터 

buf 송신완충기의 시작주소 

count 송신완충기의 요소수(옹근수) 

datatype 매 송신완충기 요소의 자료형 
dest 목적프로쎄스의 번호(옹근수) 

tag 통보표적(옹근수) 

comm 통신기(손잡이) 

줄구파라메 터 

request : 통신요구(손잡이) 

- MPI_Irsend 

비 차단준비 전 송을 진 행 한다. 

문법 

#include " mpi . h " 

int MPI _ Irsend ( void * buf , int count , MPI_Datatype datatype , 

int dest , int tag , MPI_Comm comm , MPI_Request ^request ) 

입 구파라메 터 

buf 송신완충기의 시작주소 

count 송신완충기의 요소수(옹근수) 

datatype 매 송신완충기 요소의 자료형 
Dest 목적프로쎄스의 번호(옹근수) 


tag 통보표적(옹근수) 
comm 통신기(손잡이) 

줄구파라메 터 

request : 통신요구(손잡이) 

2.2 비차단자료수신 

비차단수신함수 MPI _ Irecv 는 체계가 수신완충기에 자료를 쓰기시작 
할수 있다는것을 지적하며 함수파라메터들을 체계에 넘긴 후에 조종을 
되돌린다. 

- MPI_Irecv 
비차단수신을 진행한다. 

문법 

#include " mpi . h " 

int MPI _ Irecv ( void * buf , int count , MPI_Datatype datatype , 

int source , int tag , MPI_Comm comm , MPI_Request ^request ) 

입 구파라메 터 

buf 수신완충기의 시작주소 

datatype 매 수신완충기 요소의 자료형 (손잡이) 

source 원천 프로쎄스번호(옹근수) 

tag 통보표적(옹근수) 

comm 통신기 

count 송신완충기의 요소수(옹근수) 

줄구파라메 터 

request : 통신요구(손잡이) 

[실례 4.6] 동기 및 준비상태 자료교환수법들의 리용 


float buff [1000] [ 2]； 

MPI_Status status ； 

MPI_Comm comm ； 

MPI_Request req ； 

MPI _ Comm _ rank ( comm , & rank )； 
if (rank == 0) { 

MPI _ Irecv (& buff [ l ] [1], 1000, MPI _ FLOAT , 1, 1, comm , & req )； 
MPI _ Irecv (& buff [ l ] [2], 1000, MPI _ FLOAT , 1, 2, comm , & req )； 
MPI _ Waitall (2, & req , & status )； 

} 

else if (rank == 1) { 

MPI _ Ssend (& buff [ l ] [到，1000, MPI _ FLOAT , 0, 2, comm , & status )； 
MPI _ Ssend (& buff [ l ] [1], 1000, MPI _ FLOAT , 0, 1, comm , & status )； 


1 번 프로쎄스의 첫 동기전송함수는 0 번 프로쎄스의 두번째 수신함수 
에 대응한다. 이 송신함수는 0 번 프로쎄스의 두번째 수신함수가 시동한 
후에만 그리고 0 번 프로쎄스의 첫번째 수신함수의 초기화가 끝난 후에야 
끝날것 이 다. 

2.3 비차단통신조작들의 완료함수들 

MPI_Wait 함수와 MPI_Test 함수들은 비차단송수신을 완료하는데 리용 
한다. 

전송처리의 완료란 전송프로쎄스에서 송신완충기에 대한 접근이 
가능하게 되 였을 때 이며 수신처리의 완료란 수신완충기 에 통보가 들어왔고 
수신 완충기 는 접 근가능하다는것 을 의 미 한다. 

- MPI_Wait 

MPI 비 차단송신과 수신처리 가 끝나기 를 기 다린다. 

문법 

#include " mpi . h " 


int MPI _ Wait ( MPI_Request ^ request , MPI_Status * status ) 


입구파라메터 
request : 요구(손잡이) 

줄구파라메 터 
status : 상태객 체 

- MPI_Test 

송신 또는 수신이 끝났는가를 검사한다. 

문법 

#include ” mpi . h ” 

int MPI _ Test ( MPI_Request ^ request , int * flag , MPI_Status * status ) 
입구파라메터 

request : 통신요구(손잡이) 

줄구파라메 터 

flag 연산이 성공하면 참(론리값) 
status 상태객체 

[실례 4.7] 생산자는 많고 소비자는 하나인 경우에 비차단통신을 리용한다. 

typedef struct { 

char data [ MAXSIZE ]; 
int datasize ； 

MPI_Request req ； 

) Buffer ； 
int size , rank ； 

Buffer buffer [] ； 

MPI_Status status ； 

/* 매 프로쎄스는 체계의 콤퓨터수와 자기 번호를 결정한다. */ 


MPI_Comm_rank(comm, &rank )； 

MPI_Comm_size(comm, &size )； 

/* 생 산자 */ 
if (rank != size-1) { 

/* 완충기 의 생 성 */ 

buffer=(Buffer *)malloc(sizeof(buffer ))； 

/* 주 순환 */ 
while (1) { 

/* 자료파일의 생성과 완충기에 보존된 바이트수의 복귀 */ 
produce(buffer->data, buffer- 〉 datasize); 

/* 자료전송 */ 

MPI_Send(buffer->data, buffer->datasize, MPI_CHAR, 
size-1, tag, comm )； 

} 

} 

/* rank=size-l 인 경 우(소비 자 ) */ 
else { 

/* 완충기 의 생 성 */ 

buffer=(Buffer *)malloc(sizeof(Buffer)*(size-l ))； 
for (i=0; i <= size-1 ； i++) 

/* 매 생산자로부터의 수신 */ 

MPI_Irecv(buffer[i].data ， MAXSIZE, MPI_CHAR, i, tag, comm, 
& (buffer [i].req ))； 

/* 주 순환 */ 

for (i=0; i <= size-1 ； i++) { 

MPI_Wait (& (buffer[i] .req), &status )； 

/* 실지 수신된 바이트수를 결정 */ 

MPI_Get_count(&status, MPI_CHAR, & (buffer[i] .datasize ))； 

/* 자료요소수신완충기 */ 
consume(buffer [i] .data, buffer [i] .datasize )； 

/* 새 로운 수신 */ 

MPI_Irecv(buffer[i].data, MAXSIZE, MPI_CHAR, i, tag, 
comm, & (buffer [i] .req ))； 



매 생산자는 무한순환으로 돌아가며 매 순환에서는 하나의 통보를 생산 
하고 그것을 전송한다 . 소비자는 매 생산자와 접속하여 통보를 받는다 . 

[실례 4 .到 생산자는 많고 소비자는 하나인 경우 MPI_Test 함수를 리용한 
비차단통신실례 

typedef struct { 

char data[MAXSIZE]; 
int datasize ； 

MPI_Request req ； 

} Buffer ； 

Buffer buffer [] ； 

MPI_Status status ； 

/* 매 프로쎄스는 체계의 콤퓨터 수와 자기 번호를 결정한다 . */ 
MPI_Comm_rank(comm, &rank )； 

MPI_Comm_size(comm, &size )； 

/* 생 산자 */ 
if (rank != size-1) { 

/* 완충기 의 생 성 */ 

buffer=(Buffer *)malloc(sizeof(buffer ))； 

/* 주 순환 */ 
while(l) { 

/* 자료파일의 생성과 완충기에 보존된 바이트수의 복귀 */ 
produce(buffer->data, buffer- 〉 datasize); 

/* 자료전송 */ 

MPI_Send(buffer->data, buffer->datasize, MPI—CHAR, 
size-1, tag, comm )； 

} 

} 

/* rank=size-l ； 소비 자 */ 
else { 


/* 완충기 의 생 성 */ 

buffer=(Buffer *)malloc(sizeof(Buffer)*(size-l ))； 
for (i=0; i < size-1 ； i++) 

/* 매 생산자로부터의 수신 */ 

MPI_Irecv(buffer[i].data, MAXSIZE, MPI_CHAR, i, tag, comm, 
& (buffer [i].req ))； 

/* 주 순환 */ 
i=0; 

while (1) { 

for (flag=0 ； !flag ； i=(i+l)%(size-l)) { 

/* 수신완료검 사 */ 

MPI_Test (& (buffer [i] .req), &flag, &status )； 

/* 실지 수신된 바이트수를 결정 */ 

MPI_Get_count(&status, MPI_CHAR, & (buffer [i] .datasize ))； 

/* 소비자함수호출 */ 

consume(buffer [i] .data, buffer[i] .datasize )； 

/* 새 로운 수신 */ 

MPI_Irecv(buffer[i] .data, MAXSIZE, MPI_CHAR, i, tag, 
comm, & (buffer [i] .req ))； 


여기에서 만일 생산자로부터 오는 통보가 없으면 소비자프로쎄스는 이 
전 생산자에게로 돌아간다 . 우의 프로그람의 MPI_Wait 대신에 MPI_Test 를 
리용하면 “ 선래선봉사 ” 형식으로 동작한다 . 

아래에서는 비차단연산들의 의미에 대하여 구체적으로 본다 . 

[실례 4.9] 

MPI_Comm_rank(comm, &rank )； 
if (rank == 0) { 

MPI_Isend(a, 1, MPI_FLOAT, 1, 0, comm, &rl )； 

MPI_Isend(b, 1, MPI_FLOAT, 1, 0, comm, &r2 )； 


else if (rank == 1) { 

MPI_Irocv(a, 1, MPI_FLOAT, 0, 0, comm, &rl )； 

MPI_Irecv(b, 1, MPI—FLOAT, 0, 0, comm, &r2 )； 

} 

MPI_Wait(&r2, &status )； 

MPI_Wait(&rl, &status )； 

0 번 프로쎄스의 첫번째 송신은 1 번 프로쎄스의 첫 수신과 정합된다 . 
순서 결정 은 송신 연산과 수신 연산이 정 합될것을 요구한다 . 

[실례 4.10] 비차단연산들의 완료순서 

MPI_Comm_rank(comm, &rank )； 

flagl=false; 

flag2=false; 

if (rank == 0) { 

MPI_Isend(a, n, MPI_FLOAT, 1, 0, comm, &rl )； 

MPI_Isend(b, 1, MPI_FLOAT, 1, 0, comm, &r2 )； 
whileO(flag 1 && flag2)) { 
if (! flagl) 

MPI_Test(&rl, &flagl, &s )； 
if (! flag2) 

MPI 一 Test(&r2, &flag2, &s )； 


else { 

if (rank == 1) { 

MPI_Irecv(a, 1, MPI_FLOAT, 0, 0, comm, &rl )； 
MPI_Irecv(b, 1, MPI—FLOAT, 0, 0, comm, &r2 )； 
whileO(flagl && flag2)) { 
if (! flagl) 

MPI_Test(&rl, &flagl, &s )； 
if (! flag2) 

MPI_Test(&r2, &flag2, &s )； 


실례 4.9 에서와 같이 0 번 프로쎄스의 첫째 전송은 1 번 프로쎄스의 첫 
수신과 정합된다 . 그러나 두번째 수신은 첫번째 수신전에 끝날수 있고 두 
번째 전송은 첫번째 전송전에 끝날수 있다 . 특히 첫번째 자료교환의 량이 
두번째 자료교환의 량보다 더 많을 때 이 려 한 현상이 일 어난다 . 

2.4 비차단연산들의 다중완료 

한번의 호출로 여러번 호출된 비차단통신조작들을 동시에 끝내는것은 
하나씩 끝내는것보다 훨씬 편리하고 효과적 이다 . 

MPI_Waitany 함수 혹은 MPI_Testany 함수는 임의의 한개 비차단연산 
을 끝내는데， MPI_Waitall 함수 혹은 MPI_Testall 함수는 이미 시작된 모든 
비차단연산들을 끝내는데， MPI_Waitsome 함수와 MPI_Testsome 함수는 
일부 비차단연산들을 끝내는데 리용한다 . 

- MPI_Waitall 

주어진 모든 통신이 끝나기를 기다린다 . 

문법 

#include "mpi.h" 

int MPI_Waitall(int count, MPI_Request array_of_requests[], 

MPI_Status array_of_statuses [] ) 

입 구파라메 터 

count 목록길이 ( 옹근수 ) 

array_of_requests 통신요구배 렬 (손잡이 배렬 ) 

줄구파라메 터 

array_of_statuses : 통신상태객체배렬 ( 상태배렬 ) 

- MPI_Waitany 

임의의 한개 송신 혹은 수신이 끝나기를 기다린다 . 


문법 

#include ” mpi.h” 

int MPI_Waitany(int count, MPI_Request array_of_requests [], 

int *index, MPI_Status *status ) 


입구파라메터 

count 목록길이 ( 옹근수 ) 

array_of_requests 요구배 렬(손잡이 배 렬 ) 

줄구파라메 터 

index 완성된 연산에 대한 손잡이첨수 ( 옹근수)，범위는 0 부터 count-1 
사이의 값이다 . 
status 객 체 상태 

설명 

만일 모든 요구가 MPI_REQUEST_NULL 이면 index 는 MPI_UNDEF 
INED 값으로서 복귀되며 상태 status 는 빈 상태로 복귀된다 . 

- MPI_Waitsome 

일부 주어진 통신들이 끝나기를 기다린다 . 

문법 

#include ” mpi.h” 

int MPI_Waitsome(int incount, MPI_Request array_of_requests [] ， 
int *outcount, int array_of_indices[], MPI_Status 

array_of_statuses [] ) 


입구파라메터 

incount array_of_requests 의 길 이 ( 옹근수 ) 

array_of_requests 요구배 렬 (손잡이 배 렬 ) 


줄구파라메 터 
outcount 


완료된 요구의 개수 ( 옹근수 ) 


array_of_indices 완료된 연산들의 첨수배렬 ( 옹근수배렬 ) 
array_of_statuses 완료된 연 산들의 상태 객 체 배 렬 (상태 배 렬 ) 

송신연산들에서 상태 

송신연산들에서 상태를 리용하는 경우는 오직 MPI_Test_cancelled 함수 
를 호출하거나 또는 어떤 오유가 있는 경우인데 이 경우에는 상태객체 
status 의 MPI_ERROR 마당이 설정된다 . 


- MPI_Testall 

이전에 시작되였던 모든 통신이 끝났는가를 검사한다 . 

문법 

#include "mpi.h" 

int MPI_Testall( int count, MPI_Request array_of_requests[], 

int *flag, MPI_Status array_of_statuses [] ) 

입 구파라메 터 

count 목록길이 ( 옹근수 ) 

array_of_requests 요구배 렬(손잡이 배 렬 ) 

줄구파라메 터 

flag 론리값 

array_of_statuses 상태 객 체 배 렬 (상태 배렬 ) 

설명 

기발 flag 는 오직 모든 요구들이 완료되였을 때에만 참이다 . flag 가 
거짓인 경우에 array_of_requests 와 array_of_statuses 중 어느것도 갱신 
되지 않는다 . 

- MPI_Testany 

이미 시작된 통신들중 임의의 하나가 끝났는가를 검사한다 . 

문법 

#include "mpi.h" 


int MPI_Testany(int count, MPI_Request array_of_requests[], 

int *index, int *flag, MPI_Status *status ) 


입구파라메터 

count 목록길 이 (옹근수) 

array_of_requests 요구배 렬 (손잡이 배 렬) 

줄구파라메 터 

index 완성된 연산의 첨수，완성되지 않았으면 
MPLUNDEFINED 값 (옹근수) 
flag 연산중의 하나가 완료되 면 참(론리형 ) 
status 상태객체 

- MPI_Testsome 

일부 지정된 통신들이 끝났는가를 검사한다. 

문법 

#include ” mpi.h” 

int MPI_Testsome(int incunt, MPI_Request array_of_requests [], 
int *outcount, int array_of_indices [], MPI_Status 

array_of_statuses [] ) 


입구파라메터 

incount 요구배 렬의 길이 (옹근수) 

array_of_requests 요구배 렬(손잡이 배 렬) 

줄구파라메 터 

outcount 완성된 요구개수(옹근수) 

array_of_indices 완성된 연산들의 첨수배렬(옹근수배렬) 
array_of_statuses 완성 된 연 산들의 상태 객 체 배 렬 (상태 배 렬 ) 

[실례 4.11] MPI_Waitany 함수를 리용하는 생산자-소비자 


typedef struct { 


char data[MAXSIZE]; 
int datasize ； 

) Buffer ； 

Buffer buffer [] ； 

MPI_Status status ； 

MPI_Request req[] ； 

/* 매 프로쎄스에서 체계의 프로쎄스개수와 자기 번호를 결정한다 . */ 
MPI_Comm_rank(comm, &rank )； 

MPI_Comm_size(comm, &size )； 

/* 생 산자 */ 
if (rank != size-1) { 

/* 완충기 의 생 성 */ 

buffer=(Buffer *)malloc(sizeof(buffer ))； 

/* 주 순환 */ 
while (1) { 

/* 자료파일의 생성과 완충기에 보존된 바이트수의 복귀 */ 
produce(buffer->data, &buffer->datasize )； 

/* 자료전송 */ 

MPI_Send(buffer->data, buffer->datasize, MPI_CHAR, 
size-1, tag, comm )； 

} 

} 

/* rank=size-l ； 소비 자 */ 
else { 

/* 완충기의 생성 */ 

buffer=(Buffer *)malloc(sizeof(Buffer)*(size-l ))； 
req=(MPI_Request *)malloc(sizeof(MPI_Request)*(size-l ))； 
for (i=0; i<= size-1 ； i++) { 

/* 매 생산자로부터의 수신초기화 */ 

MPI_Irecv(buffer[i].data, MAXSIZE, MPI_CHAR, i, tag, comm, 
&req[i ])； 

/* 기 본순환 */ 
while (1) { 



MPI_Waitany(size-1, req, &i, &status )； 

/* 실지 수신된 바이트수를 결정 */ 

MPI_Get_count(&status, MPI_CHAR, & (buffer [i] .datasize ))； 
/* 소비자함수호출 */ 

consume(buffer [i] .data, buffer [i] .datasize )； 

/* 새 로운 수신 */ 

MPI_Irecv(buffer[i] .data, MAXSIZE, MPI_CHAR, i, tag, 
comm, &req[i ])； 


이 프로그람은 실례 4.7 과 같은 동작을 수행한다 . 여기에서 리용하는 
MPI_Waitany 함수는 끝난 교환연산을 찾기위한 프로그람의 불필요한 
중복작업을 없애게 한다 . 그러나 이 프로그람은 실례 4.7 의 프로그람과는 
달리 생산자의 지연을 방지하지는 못한다 . 

[실례 4.12] 지연이 없는 생산자봉사프로그람 

typedef struct { 

char data[MAXSIZE ]； 
int datasize ； 

) Buffer ； 

Buffer buffer [] ； 

MPI 一 Status status [] ； 

MPI_Request req[] ； 
int index [] ； 

/* 매 가지 는 체계의 콤퓨터 수와 자기 번호를 결정한다 . */ 
MPI_Comm_rank(comm, &rank )； 

MPI_Comm_size(comm, &size )； 

/* 생 산자 */ 
if (rank != size-1) { 

/* 완충기 의 생 성 */ 


buffer=(Buffer *)malloc(sizeof(buffer)); 

/* 주 순환 */ 

while(l) { 

/* 자료파일의 생성과 완충기에 보존된 바이트수의 복귀 */ 

produce(buffer->data, &buffer->datasize )； 

/* 자료전송 */ 

MPI_Send(buffer->data, buffer- 〉 datasize, MPI_CHAR, 
size-1, tag, comm )； 

} 

} 

/* rank==size-l ； 소비자 */ 
else { 

/* 완충기의 생성 */ 

buffer=(Buffer *)malloc(sizeof(Buffer)*(size-l ))； 
req=(MPI_Request *)malloc(sizeof(MPI_Request)*(size-l ))； 
status=(MPI_Status *)malloc(sizeof(MPI_Status)*(size-l ))； 
index = (int *)malloc(sizeof(int)*(size-l ))； 
for (i=0 ； i<=size-l; i++) 

/* 매 생산자로부터의 수신 */ 

MPI_Irecv(buffer[i] .data, MAXSIZE, MPI_CHAR, i, tag, 
&req[i ])； 

/* 주 순환 */ 

while (1) { 

MPI_Waitsome(size-l, req, &count, index, &status )； 
for (i=0; i<count ； i++) { 
j=index[i] ； 

/* 실지 수신된 바이트수를 결정 */ 

MPI_Get_count(&status [i] , MPI_CHAR, 

& (buffer [j] .datasize ))； 

/* 소비자함수호출 */ 

consume(buffer [j] .data, buffer [j] .datasize )； 

/ * 새 로운 수신 */ 

MPI_Irecv(buffer[j].data, MAXSIZE, MPI_CHAR, j, tag, 
comm, &req[j ])； 


comm, 



이 프로그람은 우의 프로그람에서 나타난 지연문제률 해결한다 . 여기 
서는 소비자가 MPI_Waitany 대신에 MPI_Waitsome 을 호출한다 . 이렇게 
함으로써 우선 한번의 호출로써 여러 연산을 수행하므로 통신호출수가 줄 
어들며 소비자는 임의의 전송을 밤으므로 그 무엇도 지연시키지 않는다 . 

3. 요구객 체 해 방 

요구객체는 MPI_Wait 함수와 MPI_Test 함수를 호출하여 해방할수 있다 . 
또는 MPI_Request_free 함수를 호출하여 해방시킬수도 있다 . 

- MPI_Request_free 
통신요구객체를 해방한다 . 

문법 

#include "mpi.h" 

int MPI_Request_free( MPI_Request ^request ) 

입 구파라메 터 

request : 통신요구 ( 손잡이 ) 

4. 통신검색과 무효화 

MPI_Probe 함수와 MPI_Iprobe 함수는 들어오는 통보들을 실제적으로 
받지는 않고 검사만을 하도록 한다 . 다음에는 응용프로그람이 이 검사정보 
에 기초하여 통보들을 어떻게 받겠는가률 결정할수 있다 . 실례로 응용프로 
그람은 통보의 길이에 기초하여 수신완충기의 크기를 할당할수 있다 . 

MPI_Cancel 함수는 통신을 취소한다 . 가령 프로그람이 비차단송수신 
연산을 시작하고 후에 이 연산이 어떤 원인으로 완료되지 않을것이라고 
판단되면 리용된 기억자원들(송신 및 수신완충기들)을 해방하는데 이 함수 
를 리용한다 . 


- MPI_Probe 

통보에 대한 차단검사 

문법 

#include "mpi.h" 

int MPI_Probe( int source, int tag, MPI_Comm comm, 

MPI_Status ^status ) 

입 구파라메 터 

source 원 천프로쎄 스번호，혹은 MPI_ANY_SOURCE ( 옹근수 ) 
tag 표적값 혹은 MPI_ANY_TAG( 옹근수 ) 
comm 통신기 ( 손잡이 ) 

줄구파라메 터 
flag 론리 값 
status 상태 객 체 

- MPI_Iprobe 

통보에 대한 비차단검사 

문법 

#include "mpi.h" 

int MPI_Iprobe( int source, int tag, MPI_Comm comm, int *flag, 

MPI_Status ^status ) 


입 구파라메 터 

source 원 천 프로쎄 스번호，혹은 MPI_ANY_SOURCE ( 옹근수 ) 
tag 표적값 혹은 MPI_ANY_TAG( 옹근수 ) 
comm 통신기 ( 손잡이 ) 

줄구파라메 터 
flag 론리 값 
status 상태 객 체 


[실례 4.13] 수신측에서 통보를 받을 때 차단검사함수의 리용실례 


MPI_Comm_rank(comm, &rank )； 
if (rank == 0) 

MPI_Send(I, 1, MPI_INT, 2, 0, comm )； 
elseif (rank == 1) 

MPI_Send(x, 1, MPI_FLOAT, 2, 0, comm )； 
elseif (rank == 2) { 

for (k=l ； k<=2 ； k++) { 

MPI_Probe(MPI_ANY_SOURCE, 0, comm, &status )； 
/* 송신자가 프로쎄스 0 이면 한개 옹근수률 수신 */ 
if (status.MPI_SOURCE == 0) 

MPI_Recv(I, 1, MPI-INT, 0, 0, comm, &status )； 

/* 송신자가 프로쎄스 1 이면 한개 류점수를 수신 */ 

else 

MPI_Recv(x, 1, MPI-FLOAT, 1, 0, comm, &status )； 


[실례 4.14] 우의 프로그람과 같지만 문제가 있다 . 

MPI_Comm_rank(comm, &rank )； 
if (rank == 0) 

MPI_Send(I, 1, MPI_INT, 2, 0, comm )； 
elseif (rank == 1) 

MPI_Send(x, 1, MPI_FLOAT, 2, 0, comm )； 
elseif (rank == 2) { 
for (k=l; k<=2 ； k++) { 

MPI_Probe(MPI_ANY_SOURCE, 0, comm, &status )； 
if (status.MPI_SOURCE == 0) 

MPI_Recv(I, 1, MPIJNT, MPI_ANY_SOURCE, 

0, comm, &status )； 

else 

MPI_Recv(x, 1, MPI_FLOAT, MPI_ANY_SOURCE, 


0’ comm, &status )； 


여기서는 수신함수의 송신파라메터값으로 MPI_ANY_SOURCE 를 리용 
하였다 . 이때 프로그람의 거동은 각이하다 . 송신함수에서 보낸 통보가 아닌 
다른 통보를 받을수 있다 . 

- MPI_Cancel 

이미 초기화되였던 통신요구를 취소시킨다 . 

문법 

#include "mpi.h" 

int MPI_Cancel( MPI_Req ^request ) 

입 구파라메 터 
request : 요구 

- MPI_Test_cancelled 

요구가 취소되였는가를 검사한다 . 

문법 

#include "mpi.h" 

int MPI_Test_cancelled(MPI_Status ^status, int *flag) 

입 구파라메 터 
status : 상태객 체 

줄구파라메 터 
flag : 론리 기 발 

[실례 4.15 ] MPI_Cancel 을 리용한 프로그람 


MPI_Comm_rank(comm, &rank )； 


if (rank == 0) 

MPI_Send(a, 1, MPI_CHAR, 1, tag, comm )； 
else if (rank == 1) { 

MPI_IRecv(a, 1, MPI—CHAR, 0, tag, comm, &req )； 
MPI_Cancel(&req )； /* 수신요구를 취소 */ 
MPI_Wait(&req, &status )； 

MPI_Test_cancelled(&status, &flag )； 
if (flag) /* 통신취소성공 - 새로 수신 */ 
MPI_Recv(a, 1, MPI_CHAR, 0, tag, comm, &status )； 


MPI_Cancel 은 특이한 경우에만 리용하는 기능으로서 시간을 많이 
소비 한다 . 

5. 완충할당과 리용 

응용프로그람은 전송되는 통보들의 완충화에 리용될 완충기를 기억기 
에서 결정하여야 한다 . 완충화는 송신프로쎄스에 의하여 수행된다 . 

- MPI_Buffer_attach 
사용자가 정의한 송신용완충기를 불인다 . 

문법 

#include ” mpi.h” 

int MPI_Buffer_attach( void *buffer, int size ) 

입구파라메터 

buffer - 완충기의 시작주소 

size - 바이트단위로 계산된 완충기크기 


- MPI_Buffer 一 detach 

MPI_Bsend 등에서 리용하기 위하여 현재 완충기를 제거한다 . 


문법 

#include "mpi.h" 

int MPI_Buffer_detach( void *bufferptr, int *size ) 

줄구파라메 터 

buffer - 완충기의 시작주소 

size - 바이트단위로 계산된 완충기크기 

설명 

지적자 buffer 가 void* 로 선언되였다 할지라도 실지로는 void 형지적자 
의 주소이다 . 

[실례 4.16] 완충기의 리용，련결，해제 


#define BUFFSIZE 10000 
int size ； 
char *buff ； 

buf= (char *)malloc(BUFFSIZE); 

MPI_Buffer_attach(buff, BUFFSIZE )； 

/* MPI_Bsend 함수는 10 000 byte 크기 의 완충기 를 리 용할수 있다 .*/ 

MPI_Buffer_detach(&buff, &size )； 

/* 완충기 의 크기 는 0 byte 로 된다 . */ 

MPI_Buffer_attach(buff, BUFFSIZE )； 

/* 완충기 에 다시 10 000 byte 를 할당 */ 


6. 동시호출가능성 


MPI 에서 매개 프로쎄스는 마치도 병렬로 실행되는것처럼 보이는 
몇개의 부분프로쎄스(제각기 입구자료 및 중간자료와 상태벡토르를 가지고 
일정 한 기 억 구역 에 들어있는 프로그람코드)들을 구성성분으로 가질수도 
있 다 . 


매개 부분프로쎄스에는 실행시간구간이 순서대로 주어진다 . 이 시간 
구간이 끝나는데 따라 현재의 부분프로쎄스는 중단되고 대기렬에 들어가며 
조종은 다음 순서의 부분프로쎄스에 일정 한 시 간동안 넘어 간다 . MPI 는 
다중부분프로쎄스실행에서 차단통신함수의 호출과 부분프로쎄스계획화와의 
호상작용을 처리하지 못한다 . 부분프로쎄스가 차단통신을 진행하는 경우 
송신완충기에 대한 접근은 이 부분프로쎄스에 대해서만 차단된다 . 
부분프로쎄스들이 공통적인 자료를 가지고있을수 있기때문에 다음과 같은 
상황이 발생할수 있다 . 현재의 부분프로쎄스는 어떤 완충기의 송신처리를 
시작하였지만 시간구간이 끝났으므로 중단되며 조종은 다음 부분프로 
쎄 스에 넘어 간다 . 이 때 이 전 부분프로쎄 스의 송신완충기 에 접 근할수 있다 . 
이 경우 이 완충기접근은 다른 가지에 의해 차단되지 않는다 . 결국 
완충기의 송신결과도 이전의 부분프로쎄스에 의해 결정되지 않는다 . 

7. 송수신결합함수 

한번 호출하여 송신과 수신을 함께 하는 특수한 함수이다 . 이 함수는 
프로쎄스가 통보를 보내고 받는데 유익하다 . 실례로 두 프로쎄스사이의 
자료교환이나 프로쎄스사슬에서의 자료이동 등을 들수 있다 . 

- MPI_Sendrecv 
통보를 수신하고 보낸다 . 

문법 

#include "mpi.h" 

int MPI_Sendrecv(void *sendbuf, int sendcount, MPI_Datatype 

sendtype, int dest, int sendtag, 

void *recvbuf, int recvcount, MPI_Datatype recvtype, 
int source, int recvtag, MPI_Comm comm, MPI_Status 
^status ) 

입 구파라메 터 

sendbuf 송신 완충기의 시작주소 
sendcount 송신완충기의 요소개수 ( 옹근수 ) 



sendtype 

송신완충기의 요소자료형 ( 손잡이 ) 

dest 

목적프로쎄스의 번호 ( 옹근수 ) 

sendtag 

송신통보표적 ( 옹근수 ) 

recvcount 

수신완충기의 요소개수 ( 옹근수 ) 

recvtype 

수신완충기의 요소자료형 ( 손잡이 ) 

source 

원천프로쎄스의 번호 ( 옹근수 ) 

recvtag 

수신통보표적 ( 옹근수 ) 

comm 

통신기 ( 손잡이 ) 


줄구파라메 터 

recvbuf 출구완충기 의 시 작주소 
status 상태객체，수신연산과 관련 

- MPI_Sendrecv_replace 

한개의 완충기률 리용하여 송신하고 수신한다 . 

문법 

#include "mpi.h" 

int MPI_Sendrecv_replace(void *buf, int count, MPI_Datatype 
datatype, int dest, int sendtag, int source, int recvtag, 

MPI_Comm comm, MPI_Status ^status ) 


입 구파라메 터 

count 송신 및 수신완충기에서 요소수 ( 옹근수 ) 

datatype 송신 및 수신완충기에서 요소자료형 ( 옹근수 ) 

dest 목적프로쎄스의 번호 ( 옹근수 ) 

sendtag 송신 통보표적 ( 옹근수 ) 

source 원천프로쎄스의 번호 ( 옹근수 ) 

recvtag 수신통보표적 ( 옹근수 ) 

comm 통신기 ( 손잡이 ) 

줄구파라메 터 

buf 송신 및 수신완충기의 시작주소 


status 상태객체 


8. 고정통신호출 

같은 파라메터목록을 가진 통신을 병렬계산의 내부순환에서 여러번 
진행해야 할 필요가 자주 제기된다 . 이 경우에 고정통신호출에 파라메터 
목록을 한번만 보내고 다음에는 송신을 시작하고 끝내도록 다중호출을 
써서 통신을 최량화하는것이 가능하다 . 

- MPI_Send_init 

표준전송에 대한 손잡이를 구축 

문법 

#include "mpi.h" 

int MPI_Send_init(void *buf, int count, MPI_Datatype datatype, 
int dest, int tag, MPI_Comm comm, MPI_Request ^request ) 

입 구파라메 터 

buf 송신완충기의 시작주소 ( 선택 ) 

count 송신하는 요소의 개수 ( 옹근수 ) 
datatype 매 요소의 자료형 ( 손잡이 ) 
dest 목적프로쎄스의 번호 ( 옹근수 ) 

tag 통보표적 ( 옹근수 ) 

comm 통신기 ( 손잡이 ) 

줄구파라메 터 

request 통신요구 ( 손잡이 ) 

- MPI_Recv_init 

수신을 위한 손잡이를 구축 

문법 

#include "mpi.h" 

int MPI_Recv_init(void *buf, int count, MPI_Datatype datatype, 


int source, int tag, MPI_Comm comm, MPI_Request ^request ) 


입 구파라메 터 

buf 수신완충기의 시작주소 

count 수신되는 요소수 ( 옹근수 ) 
datatype 매 요소형 ( 손잡이 ) 

source 원천프로쎄스의 번호 혹은 MPI_ANY_SOURCE ( 옹근수 ) 
tag 통보표적 혹은 MPI_ANY_TAG ( 옹근수 ) 

comm 통신기 ( 손잡이 ) 

줄구파라메 터 

request : 통신요구 ( 손잡이 ) 

- MPI_Start 

요구손잡이를 가지고 통신을 시작하도록 한다 . 

문법 

#include "mpi.h" 

int MPI_Start( MPI_Request ^request) 

입 구파라메 터 

request : 통신요구 ( 손잡이 ) 

- MPI_Startall 

요구들의 모으기를 시작한다 . 

문법 

#include "mpi.h" 

int MPI_Startall(int count, MPI_Request array_of_requests [] ) 

입 구파라메 터 

count 목록길 이 ( 옹근수 ) 

array_of_requests 요구배 렬(손잡이 배 렬 ) 


- MPI_Ssend_init 

동기전송을 위한 손잡이를 구축한다 . 

문법 

#include "mpi.h" 

int MPI_Ssend_init( void *buf, int count, MPI_Datatype datatype, int 
dest, int tag, MPI_Comm comm, MPI_Request ^request ) 

입 구파라메 터 

buf 송신완충기의 시작주소 ( 선택 ) 

count 전송할 요소개수 ( 옹근수 ) 

datatype 매 요소의 자료형 ( 손잡이 ) 
dest 목적프로쎄스의 번호 ( 옹근수 ) 

tag 통보표적 ( 옹근수 ) 

comm 통신기 ( 손잡이 ) 

줄구파라메 터 

request : 통신요구 ( 손잡이 ) 

- MPI_Bsend_init 

완충전송을 위한 손잡이를 구축한다 . 

문법 

#include "mpi.h" 

int MPI_Bsend_init(void *buf, int count, MPI_Datatype datatype, int 
dest, int tag, MPI_Comm comm, MPI_Request ^request ) 

입 구파라메 터 

buf - 송신완충기의 시작주소 

count - 전송할 요소의 수 

datatype - 매 요소의 형 
dest - 목적프로쎄스번호 

tag - 통보표적 

통신기 


comm - 


줄구파라메 터 
request - 통신요구 

- MPI_Rsend_init 

기다림전송에 대한 손잡이를 구축한다 . 

문법 

#include "mpi.h" 

int MPI_Rsend_init( void *buf，int count, MPI_Datatype 

datatype, int dest, int tag, MPI_Comm comm, 

MPI_Request ^request ) 


입 구파라메 터 

buf 송신완충기의 시작주소 ( 선택 ) 

count 전송할 요소개수 ( 옹근수 ) 

datatype 매 요소형 ( 손잡이 ) 
dest 목적프로쎄스의 번호 ( 옹근수 ) 

tag 통보표적 ( 옹근수 ) 

comm 통신기 ( 손잡이 ) 

줄구파라메 터 

request : 통신요구 ( 손잡이 ) 


제 5 절 집합연산 


1. 개념 


집합통신은 함수의 내부통신기파라메터로 지적해준 그룹안의 모든 프로 
쎄스들에 관해서 자료교환을 보장한다 . 앞으로는 그룹을 내부동신기에 
련결된 프로쎄스부분모임으로 본다 . MPI 는 다음과 같은 집합통신함수들을 


제공하고 있 다 . 


- 동기 화 (barrier) 

그룹의 모든 프로쎄스들을 동기화한다 . 

- 대역통신함수들 

* 그룹의 한 프로쎄스로부터 그룹의 전체 프로쎄스들에로의 자료전송 

(broadcast) 

* 그룹의 전체 프로쎄스들로부터 이 그룹의 한 프로쎄스에로의 

자료수집 (gather) 

* 그룹의 한 프로쎄스로부터 그룹의 모든 프로쎄스들에로 자료분산 

(scatter) 

* 그룹의 모든 프로쎄스에 따르는 순환에서 의 자료수집 (allga1;her) 

* 그룹의 모든 성원들로부터 모두에로의 자료분산/수집 

(scatter/gather) 

- sum, max, min 형 대 역 축소연산 혹은 사용자정 의 함수들 

* 결과가 그룹의 모든 프로쎄스들에 보내지는 축소와 결과가 그룹의 

한 프로쎄스에만 보내지는 축소 (allreduce/reduce) 

* 련결축소， scatter 연산，그룹의 모든 원소들에 따르는 중첩 

집합함수들의 문법과 의미는 점대점 (point-to-point) 연산과 어느 정도 
류사하지만 비교적 제한적이다 . 한가지 제한은 점대점 (point-to-point) 
연산과는 달리 전송한 자료수는 수신자가 지적한 자료수와 정확히 일치 
하여 야 한다는것이다 . 

집합함수들에서 기본적으로 같은 측면은 이것들이 모두 차단이라는것 
이다 . 집합함수들은 표적파라메터를 리용하지 않으며 매 그룹내에서 집합 
호출통신 구역 들은 실 행 순서 에 준하여 엄 격 하게 규정 되 여 있 다 . 

또 한가지 특징은 집합연산들이 모두 자료교환수법으로서 점대점연산의 
표준규칙과 류사한 수법을 리용한다는것 이다 . 

2. 동기화와 자료의 방송 

MPI_Barrier 함수는 그룹안의 모든 프로쎄스성원들이 모두 이 함수를 
호출할 때까지 그 실행을 차단시킨다 . 



- MPI_Barrier 

모든 프로쎄스들이 이 함수에 도달할 때까지 차단시킨다 . 


문법 

#include ” mpi.h” 

int MPI_Barrier( MPI_Comm comm ) 

입구파라메터 
comm - 통신기 

- MPI_Bcast 

번호가 root 인 프로쎄스로부터 그룹의 다른 모든 프로쎄스들에로 
통보를 방송한다 . 

문법 

#include ’’mpi.h” 

int MPI_Bcast( void *buffer, int count, MPI_Datatype 
datatype, int root, MPI_Comm comm ) 

입구파라메터 

buffer - 완충기의 시작주소 

count - 완충기의 요소의 수 

datatype - 완충기 요소의 자료형 
root - 방송하는 프로쎄스의 번호 

comm - 통신기 

알고리 듬 

선형알고리 듬을 리 용하여 하나의 블로크안에 있는 자료를 첫 번째 프로 
쎄스로부터 다른 모든 프로쎄스들에로 방송한다 . 

[실례 5.1] MPI_Bcast 리용실례 


MPI_Comm comm ； 
int array[100 ]； 


int root=0; 


MPI_Bcast(array, 100, MPI—INT, root, comm )； 

0 번 프로쎄스의 옹근수배 렬 array 안에 있는 100 개의 int 형 옹근수들을 
0 번 프로쎄스로부터 그룹의 모든 프로쎄스들에 전송한다 . 

3. 자료수집 

- MPI_Gather 

그룹안의 모든 프로쎄스들로부터 지정된 완충기의 내용을 프로쎄스 
root 의 보다 큰 다른 완충기 에 모아놓는다 . 

문법 

#include "mpi.h" 

int MPI_Gather( void *sendbuf, int sendcount, MPI_Datatype 
sendtype, void *recvbuf, int recvcount, MPI_Datatype 

recvtype, int root, MPI_Comm comm ) 


입 구파라메 터 

sendbuf 송신완충기의 시작주소 ( 선택 ) 
sendcount 송신완충기 의 요소의 개 수(옹근수형 ) 
sendtype 송신완충기요소의 자료형 ( 손잡이 ) 
recvcount 매 프로쎄스에서 수신요소들의 수 ( 옹근수 ) 
recvtype 수신완충기요소의 자료형 ( 손잡이 ) 
root 수신프로쎄스의 번호 ( 옹근수 ) 

comm 통신기 ( 손잡이 ) 

줄구파라메 터 

recvbuf : 수신 완충기의 시 작주소 
[실례 5.2] MPI_Gather 함수의 리용실례를 보여준다 . 


MPI Comm comm ； 


int gsize, sendarray [100] ； 
int root, *rbuf ； 

MPI_Comm_size(comm, &gsize )； 
rbuf= (int *)malloc(gsize*100*sizeof(int ))； 

MPI_Gather(sendarray, 100, MPIJNT, rbuf, 100, MPIJNT, 
root, comm )； 


모든 프로쎄스들 


100 100 100 



프로쎄스 root 


[실례 5.3] 우의 코드와 비슷하지만 여기에서는 뿌리프로쎄스만이 수신용 
완충기 (rbuf) 를 할당한다 . 

MPI_Comm comm ； 

int gsize, sendarray [100] ； 

int root, *rbuf, myrank ； 

MPI_Comm_rank(comm, &myrank )； 
if (myrank == root) { 

MPI_Comm_size(comm, &gsize )； 
rbuf= (int *)malloc(gsize*100*sizeof(int ))； 









MPI_Gather(sendarray, 100, MPIJNT, rbuf, 100, MPIJNT, 
root, comm )； 

그룹의 매 프로쎄스로부터 100 개의 int 형 옹근수를 root 의 수신완충기 
rbuf 에 모아놓는다 . 

[실례 5.4] 우의 코드와 비슷하지만 여기서는 임의의 datatype 를 리용한다 . 

MPI_Comm comm ； 
int gsize ； 
int *rbuf; 

int sendarray [100] ； 
int root=0; 

MPI_Comm_size(comm, &gsize )； 
rbuf= (int *)malloc(gsize*100*sizeof(int ))； 


MPI_Gather(sendarray, 100, MPIJNT, rbuf, 100, MPIJNT, 
root, comm )； 

다음으로 MPI_Gather 함수의 변종인 MPI_Gatherv 함수를 보기로 한다 . 


- MPI_Gatherv 

그룹안의 모든 프로쎄스들로부터 완충기의 내용을 모든 프로쎄스들의 
지정된 위치에로 수집한다 . MPI_Gather 와의 차이점은 모든 프로쎄스들 
에 서 보내 고 받는 자료의 개 수가 다 차이난다는것 이 다 . 

문법 

#include ” mpi.h” 

int MPI_Gatherv( void *sendbuf, int sendcount, MPI_Datatype 
sendtype, void *recvbuf, int *recvcounts, int *displs, 
MPI_Datatype recvtype, int root, MPI_Comm comm ) 


입구파라메터 


sendbuf 송신완충기의 시작주소 ( 선택 ) 
sendcount 송신완충기에서 요소의 개수 ( 옹근수 ) 
sendtype 송신완충기요소의 자료형 ( 손잡이 ) 

recvcounts 매 프로쎄스로부터 수신되 는 요소수를 담고있는 옹근수 
배렬(크기는 그룹크기 ) (root 에서만 의미가 있음 ) 
displs 그룹크기만한 옹근수배렬， 요소 i 는 프로쎄스 i 로부터 

들어 오는 자료를 넣을 recvbuf 의 시 작으로부터의 변위 
recvtype 수신완충기요소의 자료형 ( 손잡이 ) 
root 수신프로쎄스의 번호 ( 옹근수 ) 

comm 통신기 ( 손잡이 ) 

줄구파라메 터 

recvbuf : 수신된 완충기의 시 작주소 
[실례 5.5] MPI_Gatherv 를 리용한 실례 


MPI_Comm comm ； 

int gsize, rank, sendarray [100] ； 

int root, *rbuf ； 

int displs, i, rcounts ； 

int stride=100; 

MPI_Comm_size(comm, &gsize )； 
rbuf = (int *)malloc(gsizestride*sizeof(int ))； 
displs = (int *)malloc(gsize*sizeof(int ))； 
rcounts = (int *)malloc(gsize*sizeof(int ))； 
for (i=0;i<gsize;++i) { 
displs [i] =i*stride ； 
rcounts [i] = 100; 

} 

MPI_Gatherv(sendarray, 100 , MPI—INT, rbuf, rcounts, displs, 
MPI—INT, root, comm )； 


매 프로쎄스는 100 개의 원소를 전송한다 . 수신프로쎄스에서 이 블로크 


들은 수신완충기시작으로부터 어떤 변위만큼 떨어지면서 할당되여야 한다 . 
이것을 위해 MPI_Gatherv 함수와 displs 파라메터를 리용한다 . 우에서 
stride 는 변위와 변위사이의 폭을 의미하는데 100 으로 한다 . 

[실례 5.6] MPI_Gatherv 를 리용한 실례 

우의 실례와 같지만 100*150 행렬에서 0 번째 렬의 100 개 원소를 전송 
한다 . 

MPI_Comm comm ； 

int gsize, sendarray [100] [150] ； 

int root, *rbuf, stride ； 

int displs, i, rcounts ； 

MPI_Datatype stype ； 

MPI_Comm_size(comm, &gsize )； 
rbuf = (int *)malloc(gsizestride*sizeof(int ))； 
displs = (int *)malloc(gsize*sizeof(int ))； 
rcounts = (int *)malloc(gsize*sizeof(int ))； 
for (i=0;i<gsize;++i) 

{ displs [i] =i*stride ； 
rcounts [i] = 100; 

} 

/* 100*150 행렬에서 한개 렬에 대한 자료형구축 */ 
MPI_Type_vector(100, 1, 150, MPI—INT, &stype )； 
MPI_Type_commit(&stype )； 

MPI_Gatherv(sendarray, 1 ， &stype, rbuf, rcounts, displs, 

MPI-INT, root, comm )； 

[실례 5.7] 프로쎄스 오는 100*150 행렬의 i 번째 렬의 (1 ⑷ -i) 개 원소를 
전송한다 . 

MPI_Comm comm ； 

int gsize, sendarray [100] [150], *sptr ； 
int root, *rbuf, stride, my rank ； 


int displs, i, rcounts ； 

MPI_Datatype stype ； 

MPI_Comm_size(comm, &gsize )； 

MPI_Comm_rank 乂 comm, &myrank )； 
rbuf = (int *)malloc(gsizestride*sizeof(int ))； 
displs = (int *)malloc(gsize*sizeof(int ))； 
rcounts = (int *)malloc(gsize*sizeof(int ))； 
for (i=0;i<gsize;++i) { 
displs [i] =i*stride ； 
rcounts [i] = 100-i; 

} 

/* 전송하는 한개 렬에 대한 자료형 구축 */ 

MPI_Type_vector( 1 00-myrank, 1, 150, MPI_INT, &stype )； 
MPI_Type_commit(&stype )； 

/* sptr 는 100*150 행렬에서 myrank 번째 렬의 시작주소 */ 
MPI_Gatherv(sptr, 1, stype, rbuf, rcounts, displs, 

MPI-INT, root, comm )； 

결국 매 프로쎄스로부터 각이한 개수의 자료들을 받게 된다 . 

4. 자료분산 

자료분산에는 MPI_Scatter 함수와 MPI_Scatterv 함수들이 있다 . 

- MPI_Scatter 

자료를 그룹의 한 프로쎄스로부터 다른 프로쎄스로 보낸다 . 

문법 

#include ” mpi.h” 

int MPI_Scatter( void *sendbuf, int sendcount, MPI_Datatype 
sendtype, void *recvbuf, int recvcount, MPI_Datatype recvtype, 

int root, MPI_Comm comm ) 


입 구파라메 터 

sendbuf 완충기 주소 

sendcount 매 프로쎄스에 전송될 요소의 수 ( 옹근수 ) 
sendtype 송신완충기원소들의 자료형 ( 손잡이 ) 
recvcount 수신완충기의 요소수 ( 옹근수 ) 
recvtype 수신완충기요소들의 자료형 ( 손잡이 ) 
root 전송프로쎄스의 번호 ( 옹근수 ) 

comm 통신기 ( 손잡이 ) 

줄구파라메 터 

recvbuf : 수신완충기의 주소 

[실례 5.8] MPI—Scatter 의 리용실례 

MPI_Comm comm ； 
int gsize, *sendbuf ； 
intrbuf[100] ； 
int root=0 ； 

MPI_Comm_size(comm, &gsize )； 

sendbuf=(int *)malloc(gsize*100*sizeof(int ))； 


MPI_Scatter(sendbuf, 100, MPIJNT, rbuf, 100, 

MPI-INT, root, comm )； 

프로쎄 스 root 는 sendbuf 안의 int 형 옹근수 100 개를 그룹의 모든 프로 
쎄스들에 전송하며 완충기 rbuf 에 넣는다 . 

- MPI_Scatterv 

매 프로쎄스에 불규칙적 인 개수의 자료들을 전송한다 . 

문법 

#include "mpi.h" 

int MPI_Scatterv( void ^sendbuf, 


int *sendcounts, int *displs, 


MPI_Datatype sendtype, void *recvbuf, int recvcount, 
MPI_Datatype recvtype, int root, MPI_Comm comm ) 


입구파라메터 

sendbuf 송신완충기의 시작주소 

sendcounts 매 프로쎄 스에 보낼 요소수를 지 정 하는 옹근수배 렬 (크기 는 
그룹크기) 

displs 옹근수배렬(그룹크기)， i 째 요소는 sendbuf 로부터의 변위값 

으로서 프로쎄스 i 로 보낼 블로크의 시 작위치를 지 정 
sendtype 송신완충기요소들의 자료형(손잡이) 
recvcount 수신완충기의 요소수(옹근수) 
recvtype 송신완충기요소들의 자료형(손잡이) 
root 전송프로쎄스의 번호(옹근수) 

comm 통신기(손잡이) 

줄구파라메 터 

recvbuf : 수신완충기 의 주소 


[실례 5.9] MPI_Scatterv 의 리용실례 1，[실례 5.5] 와 반대이다. 

뿌리프로쎄스는 다른 프로쎄스들에 100 개의 요소를 전송하는데 이 
100 개의 요소들은 송신완충기에 걸음 stride(〉100) 만큼씩 떨어져서 
놓이게 된다. 

MPI_Comm comm； 
int gsize, *sendbuf； 

int root, rbuf [100], i, *displs, *scounts； 

MPI_Comm_size(comm, &gsize)； 

sendbuf=(int *)malloc(gsize*stride*sizeof(int))； 


displs=(int *)malloc(gsize*sizeof(int))； 
scounts=(int *)malloc(gsize*sizeof(int))； 
for (i=0; i<gsize； ++i) { 
displs [i] =i*stride; 
scounts [i] = 100; 


MPI_Scatterv(sendbuf, scounts, displs, MPI_INT, rbuf, 100, 

MPI-INT, root, comm )； 

[실례 5.10] MPI_Scatterv 의 리용실례 2 

프로쎄스 root 의 완충기에서 전송블로크들은 블로크들사이에 일정한 
걸음씩 떨어져있는데 이 걸음크기가 가변적이다 . 수신측인 프로쎄스 i 에서 
100*150 행렬의 i 번째 렬에로 100-i 개의 요소들을 받는다 . 

MPI_Comm comm ； 

int gsize, recvarray [100] [150], *rptr ； 
int root, sendbuf, myrank, bufsize, *stride ； 

MPI_Datatype rtype ； 

int i, *displs, *scounts, offset ； 

MPI_Comm_size(comm, &gsize )； 

MPI_Comm_rank 乂 comm, &myrank )； 
stride=(int *)malloc(gsize*sizeof(int ))； 


/* i=0 부터 i=gsize-l 까지 의 stride [i] 를 설정 한다 . */ 

displs=(int *)malloc(gsize*sizeof(int ))； 
scounts=(int *)malloc(gsize*sizeof(int ))； 
offset=0; 

for (i=0; i<gsize ； ++i) { 
displs [i] ^offset ； 
offset+=stride [i] ； 
scounts [i] = 100-i; 

} 

/* 수신하는 렬을 위한 자료형구축 */ 
MPI_Type_vector(100-myrank, 1, 150, MPI_INT, &rtype )； 
MPI_Type_commit(&rtype )； 
rptr=&recvarray [0] [myrank] ； 

MPI_Scatterv(sendbuf, scounts, displs, MPI_INT, rptr, 1 ， rtype, 


root, comm )； 


- MPI_Allgather 

자료를 모든 과제들로부터 받아 모두에게로 분산시킨다 . 

문법 

#include ” mpi.h” 

int MPI_Allgather(void *sendbuf, int sendcount, MPI_Datatype 
sendtype, void *recvbuf, int recvcount, MPI_Datatype 
recvtype, MPI_Comm comm ) 

입구파라메터 

sendbuf 송신완충기의 시작주소 

sendcount 송신 완충기 의 요소수 ( 옹근수 ) 

sendtype 송신완충기요소들의 자료형 ( 손잡이 ) 

recvcount 어떤 프로쎄스로부터의 수신되는 요소수 ( 옹근수 ) 

recvtype 수신완충기요소들의 자료형 ( 손잡이 ) 

comm 통신기 ( 손잡이 ) 

줄구파라메 터 

recvbuf : 수신완충기 의 주소 

[실례 5.11] MPI_Allgather 의 리용실례 
그룹의 매 프로쎄 스에 서 는 모든 프로쎄 스부터 100 개 요소씩 받는다 . 

MPI_Comm comm ； 

int gsize, sendarray [100] ； 

int *rbuf; 


MPI_Comm_size(comm, &gsize )； 

rbuf=(int *)malloc(gsize* 100*sizeof(int ))； 

MPI_Allgather(sendarray, 100, MPI_INT, rbuf, 

100, MPIJNT, comm )； 


- MPI_Allgatherv 


모든 과제들로부터 자료를 받아 그것을 모두에게로 전송한다 . 
MPI_Gatherv 와 다른 점은 뿌리프로쎄스 하나가 아닌 모든 프로쎄스 
들이 자료를 받는다는것이다 . 

문법 

#include "mpi.h" 

int MPI_Allgatherv(void *sendbuf, int sendcount , MPI_Datatype 
sendtype, void *recvbuf, int *recvcounts, int *displs, 

MPI_Datatype recvtype, MPI_Comm comm ) 

입 구파라메 터 

sendbuf 송신 완충기의 시작주소 
sendcount 송신완충기의 요소수 ( 옹근수 ) 
sendtype 송신완충기요소들의 자료형 ( 손잡이 ) 

recvcounts 매 프로쎄 스로부터 받을 요소수가 들어 있는 옹근수배 렬 
(크기는 그룹크기 ) 

displs 옹근수배렬(크기는 그룹크기)， i 는 프로쎄스 i 로부터 

들어오는 자료가 놓일 시작위치 (recvbuf 로부터의 변위 ) 
recvtype 수신완충기요소들의 자료형 ( 손잡이 ) 
comm 통신기 ( 손잡이 ) 

줄구파라메 터 

recvbuf : 수신완충기의 주소 
5. 분산/수집 
- MPI_Alltoall 

전체로부터 전체 프로쎄스에로 자료를 보낸다 . 


문법 

#include "mpi.h" 

int MPI_Alltoall( void *sendbuf, int sendcount, MPI_Datatype 
sendtype, void *recvbuf, int recvcount, MPI_Datatype recvtype, 

MPI_Comm comm ) 


입 구파라메 터 
sendbuf 


송신완충기의 시작주소 


sendcount 

sendtype 

recvcount 

recvtype 

comm 


매 프로쎄스에로 보내는 요소의 수 
보내는 완충기요소의 자료형 
임의의 처리로부터 수신되는 요소의 수 
수신되는 완충기요소의 자료형 
통신기 


줄구파라메 터 

recvbuf - 수신완충기의 주소 
- MPI_Alltoallv 

전체로부터 전체 프로쎄스에로 가변크기의 자료를 보낸다 . 

문법 

#include "mpi.h" 

int MPI_Alltoallv( void *sendbuf, int *sendcounts, int *sdis 

pis, MPI_Datatype sendtype, void *recvbuf, int *recvcounts, 
int *rdispls, MPI_Datatype recvtype, MPI_Comm comm ) 

입구파라메터 

sendbuf - 송신 완충기의 시작주소 

sendcounts - 매 프로쎄 스로 송신요소들의 개 수률 서 술하는 


옹근수배 렬 ( 그룹크기 ) 
sdispls - 옹근수배렬 ( 그룹크기 ) 

sendtype - 보내는 완충기요소의 자료형 

recvcounts - 모든 처리기들로부터 수신될수 있는 요소들의 
최대수를 서술하는 옹근수배렬 ( 그룹크기 ) 
rdispls - 옹근수배렬 ( 그룹크기 ) 
recvtype - 수신완충기요소의 자료형 
comm - 통신기 


줄구파라메 터 

recvbuf - 수신완충기의 주소 


6. 대역축소연산 


여기서는 그룹의 모든 성원들에서의 대역축소연산 (sum, max, 론리적 
AND 등)들을 고찰한다 . 축소연산은 미리 정의된 연산들중의 하나일수도 
있고 사용자가 정의하는 연산일수도 있다 . 대역축소연산들에는 한개 마디 
에 결과를 보내는 축소와 결과를 모든 마디들에 다 보내는 축소가 있다 . 
이 외에 Reduce_scatter 와 같이 축소와 분산을 결합한 연산도 있다 . 

먼저 미리 정의된 연산들을 보기로 한다 . 


MPI—MAX - 
MPI—MIN - 
MPI—SUM - 
MPI—PROD ᅳ 
MPI—LAND - 
MPI—BAND - 
MPI—LOR - 
MPI—BOR - 
MPI_LXOR - 
MPI_BXOR - 
MPI_MAXLOG - 
MPI—MINLOG - 


최대 
최 소 
합 
적 

론리적 
비 트론리 적 
론리합 
비트론리합 
배타론리합 
배 타적 비 트론리 합 
최대값과 그 위치 
최소값과 그 위치 


- MPI_Reduce 

모든 프로쎄스들에 있는 값들을 한개 프로쎄스의 단일값으로 축소한다 . 
문법 

#include "mpi.h" 

int MPI_Reduce( void *sendbuf, void *recvbuf, int count, 
MPI_Datatype datatype, MPI_Op op, int root, MPI_Comm 

comm ) 


입 구파라메 터 

sendbuf 송신완충기의 주소 

count 송신완충기에 있는 요소개수 ( 옹근수 ) 


datatype 송신완충기의 요소들의 형 ( 손잡이 ) 

op 축소연산 ( 손잡이 ) 

root 결과를 받을 프로쎄스의 번호 ( 옹근수 ) 

comm 통신기 ( 손잡이 ) 

줄구파라메 터 

recvbuf : 수신완충기 의 주소 

[실례 5.12] PAR_BLAS1 은 그룹의 프로쎄스들에 들어 있는 두 벡 토르의 
스칼라적 을 계 산하여 결과를 0 번 프로쎄 스에 주는 연산자이다 . 

PAR_BLASl(m, a, b, c, comm) 
int m ； 

float a[], b[]; /* 배 렬들의 국부적 인 대 역 */ 

float c ； /* 결과 */ 

MPI_Comm comm ； 

{ 

int i ； 

float sum ； 

/* 국부합 */ 
sum=0.0; 
for (i=0;i<m; i++) 
sum=sum+a [i] *b [i]; 

/* 대역합 */ 

MPI_Reduce(&sum, &c, 1, MPI_FLOAT, MPI 一 SUM, 0, comm )； 
return 0 ； 


[실 례 5.13] PAR_BLAS2 는 그룹의 프로쎄 스들에 들어있는 백 토르와 
행렬의 적을 계산하여 결과를 0 번 프로쎄스에 주는 연산자이다 . 


PAR_BLAS2(m, n, a, b, c, comm) 
int m, n ； 


float a[], b[] [n];/* 배 렬들의 국부적 인 대 역 */ 
float c [n] ； /* 결과 */ 

MPI_Comm comm ； 

{ 

int i, j ； 

float sum [n] ； 

/* 국부합 */ 
for (j=0;j<n; j++) { 
sum [j] =0.0 ； 
for (i=0 ； i<m ； i++) 

sum [j] =sum [j] +a [i] *b [i] [j] ； 

} 

/* 대 역적 인 합을 구하고 결과를 0 번 프로쎄스에로 보내기 */ 
MPI_Reduce(sum, c, n, MPI_FL0AT, MPI—SUM, 0, comm )； 
return 0 ； 


- MPI_Allreduce 

모든 프로쎄스들로부터 값들을 집합연산하여 그 결과를 모든 프로쎄스 
들에 전송한다 . 


문법 

#include ” mpi.h” 

int MPI_Allreduce(void *sendbuf, void *recvbuf, int count, 
MPI_Datatype datatype, MPI 一 Op op, MPI_Comm comm ) 


입구파라메터 

sendbuf - 
count 一 
datatype - 
op - 
comm - 


송신완충기의 시작주소 
송신완충기의 요소의 수 
송신완충기의 요소의 자료형 
연산 
통신기 


줄구파라메 터 


recvbuf - 수신 완충기 의 시 작주소 


[실례 5.14] PAR_BLAS2 는 그룹의 모든 프로쎄스들에 들어있는 백토르와 
행렬의 적을 계산하여 결과를 모든 프로쎄스들에 주는 연산자이다 . 

PAR_BLAS2(m, n, a, b, c, comm) 
int m, n ； 

float a[], b[] [n];/* 배 렬들의 국부적 인 대 역 */ 
float c [n] ； /* 결과 */ 

MPI_Comm comm ； 

{ 

int i, j ； 

float sum [n] ； 


/* 국부합 */ 
for (j=0;j<n; j++) { 
sum [j] =0.0 ； 
for (i=0;i<m;i++) 
sum [j] =sum [j] +a [i] *b [i] [j] ； 

} 

/* 대역적 인 합을 구하고 결과를 모든 프로쎄스들에로 보내기 */ 
MPI_Allreduce(sum, c, n, MPI_FL0AT, MPI—SUM, comm )； 
return 0 ； 


- MPI_Reduce_scatter 

값을 집합축소하고 그 결과를 모두에게 전송한다 . 

문법 

#include ” mpi.h” 

int MPI_Reduce_scatter( void *sendbuf, void *recvbuf, int 
*recvcounts, MPI_Datatype datatype, MPI_0p op, MPI_Comm 
comm ) 


입 구파라메 터 

sendbuf 송신 완충기의 시작주소 

recvcounts 매 프로쎄스에 분산되는 결과의 요소수를 지 정하는 옹근수 
배렬，배렬은 모든 프로쎄스들에서 같아야 한다 . 
datatype 입구완충기의 요소들의 자료형 ( 손잡이 ) 

op 연산 ( 손잡이 ) 

comm 통신기 ( 손잡이 ) 

줄구파라메 터 

recvbuf : 수신 완충기의 시 작주소 

[실례 5.15] PAR_BLAS3 은 그룹의 모든 프로쎄스들에 분산되여있는 백토 
르에 행렬을 곱하여 결과를 분할된 행렬에로 보내주는 연산자이다 . 

PAR_BLAS3(m, n, k, a, b, c, comm) 
int m, n, k ； 

float a [], b [] [] ； /* 배 렬들의 국부적 인 대 역 */ 
float c [] ； /* 결과 */ 

MPI_Comm comm ； 

{ 

int i, j, gsize ； 
float sum [n] ； 
int *recvbuf ； 

/* 배렬대역크기를 모든 프로쎄스들에 보내기 */ 

MPI_Comm_size(comm, &gsize )； 
recvbuf = malloc(gsize*sizeof(int ))； 

MPI_Allgather(&k, 1, MPI_INT, recvbuf, 1, MPI_INT, comm )； 

/* 국부합 */ 
for (j=0 ； j<n ； j++) { 
sum[j] =0.0; 
for (i=0;i<m;i++) 

sum [ j] =sum [ j] +a [i] *b [i] [j]; 


/* 대 역합과 벡 토르 c 의 분할 */ 

MPI_Reduce_scatter(sum, c, recvbuf, MPI_FLOAT, 

MPI-SUM, comm )； 

/* 분할된 벡토르에 결과 보내기 */ 

return 0 ； 

} 

- MPI_Scan 

그룹에 있는 자료의 부분적인 축소를 진행한다 . 프로쎄스 
완충기 에 프로쎄 스 0~i 까지 의 송신완충기 값들이 집 합축소된다 . 

문법 

#include "mpi.h" 

int MPI_Scan( void *sendbuf, void *recvbuf, int count, 

MPI_Datatype datatype, MPI_Op op, MPI_Comm comm ) 

입 구파라메 터 

sendbuf 송신 완충기의 시작주소 
count 입구완충기의 요소수 ( 옹근수 ) 

datatype 입 구완충기의 요소자료형 ( 손잡이 ) 
op 연산 ( 손잡이 ) 

comm 통신기 ( 손잡이 ) 

줄구파라메 터 

recvbuf : 수신 완충기의 시 작주소 


7. 축소를 위 한 사용자정 의 연산들 

- MPI_Op_create 

사용자가 정의한 집합함수손잡이를 창조한다 . 
문법 

#include "mpi.h" 


int MPI_Op_create(MPI_User_function *function, int commute, 

MPI 一 Op *op ) 


입구파라메터 

function 사용자정 의 함수 ( 함수 ) 
commute 가환이면 참，그렇 지 않으면 거 짓 

줄구파라메 터 
op : 연산 ( 손잡이 ) 

- MPI_Op_free 

사용자가 정의한 집합함수손잡이를 해방한다 . 

문법 

#include ” mpi.h” 

int MPI_Op_free( MPI 一 Op *op ) 

입구파라메터 
op : 연산 ( 손잡이 ) 

설명 

op 는 MPI_OP_NULL 로 설정된다 . 

[실례 5.16] 복소수배럴들의 적을 계산 
typedef struct { 
double real, imag ； 

) Complex ； 

/* 사용자정 의함수 */ 

void myProd(Complex in, Complex inout, int *len, 
MPI_Datatype *dptr) 

{ 

int i ； 

Complex c ； 


for (i=0; i< *len ； ++i) { 

c.real= inout->real*in->real-inout->imag*in->imag ； 

c.imag= inout->real*in->imag-inout->imag*in->real ； 

*inout=c; 

in++! 

inout ++； 


/* 함수의 호출 */ 

/* 매 프로쎄스는 크기가 100 인 복소수배렬을 가진다 .*/ 

Complex a [100]， answer [100] ； 

MPI_0p myOp ； 

MPI_Datatype ctype ； 

/* 복소수형 구축 */ 

MPI_Type_contiguous(2, MPI_DOUBLE, &ctype )； 
MPI_Type_commit(&ctype )； 

/* 복소수들을 급하는 사용자연산을 생성 */ 
MPI_Op_create(myProd, true, &myOp )； 

MPI_Reduce(a, answer, 100, ctype, myOp, root, comm )； 

/* 프로쎄 스 root 에 100 개 의 복소수를 급한 결과가 들어 간다 .*/ 


제 6 절 사용자정의자료형과 자료의 묶기 

1. 개념 

우에서 본 MPI 의 통신기구들은 기억기에서 련속적으로 놓인 같은 형의 
요소별들에 대한 송수신만을 허용한다 . 그러나 실천적으로는 구조체형 
혹은 배렬구조체와 같은 동종이 아닌 요소별들을 전송하여야 할 필요성이 
많이 제기된다 . 

MPI 는 이려한 문제를 해결하기 위한 다음과 같은 두가지 방법들을 



제공하고 있 다 . 

첫째로，사용자는 임의의 자료형을 지정할수 있으며 이 형을 MPI 통신 
함수들에서 미리 정의된 기초형들과 류사하게 리용한다 . 

둘째로 , 전송프로쎄스는 몇개의 불련속기억구역들에 있는 자료들을 
하나의 련속완충기에 묶기하여 그것을 전송할수 있으며 수신프로쎄스는 
완충기 에 얻어진 자료를 갈라서 몇개의 비겹 침기 억구역들에 보관할수 있다 . 

모든 MPI 통신함수들은 자료형파라메터인 datatype 를 가지고있다 . 가장 
단순한 경우에 이것은 옹근수 (int) 혹은 류점수 (float ) 와 같은 기초자료형 
이다 . 

MPI 에서는 기초자료형들이 리용되는 모든 곳에서 사용자정의자료형 
들을 쓸수 있다 . 이것들은 프로그람작성언어의 의미 에서 “ 형 ” 이 아니며 
다만 기초형들의 기억기배치를 서술하는 형구축함수들에 의하여 MPI 가 
만드는 “ 형 ” 일 뿐이다 . 

MPI 는 사용자정 의형 들을 통하여 기 초자료형 들을 조합한 구조체 와 같은 
종합적 인 자료교환을 보장한다 . 

A 사용자자료형은 다음의 특징을 가전다 . 

-기초형들의 렬이다 . 

-시작주소로부터 시작한 이 형들의 옹근수변위 ( 바이트단위 ) 렬이다 . 

변위가 반드시 정의 값이고 증가순서로 될 필요는 없다 . 결국 사용자 
정의형 목록에서 형 값들의 순서는 기 억 기 에서의 그것들의 순서와 반드시 
일치하지 않아도 되며 형의 값들은 목록에서 한번이상 나타날수 있다 . 
이려한 쌍의 렬들을 형의 넘기기라고 한다 . 

사용자정의형은 송신 및 수신함수에서 기초형파라메터와 같이 형파라 
메터로 리용될수 있다 . 

실례로 함수 MPI_Send(buf, 1, datatype, …)은 사용자정의형의 시 작 
주소 buf 률 송신완충기의 주소로 리용하며 전송자료의 형은 파라메터 
datatype 를 리 용한다 . 

[실례 6.1] 

Type= {(double, 0), (char, 8)} (double 의 변위는 0 이고 char 의 변위는 
8 ) 라고 하자 . 그리고 이밖에 실수 (double ) 는 8byte 의 배수로 되는 주소에 


따라 놓인다고 하자 . 이때 형의 아래한계 lb(Type)=min(dispj)=0, 웃한계 
ub(Type)=max(dispj+sizeof(typej))+e=(8+l+7)=16 이고 이 형의 대역은 
16(8byte(double)+lbyte(char)=9 로서 8 의 배수로 되는 다음수는 16) 이 다 . 
이 자료형의 배치는 아래의 그림과 같다 . 


double char 


8byte lbyte e=7byte 

자료형에 관한 정보를 주는 함수들은 다음과 같다 . 

- MPI_Type_extent 

자료형의 범위를 준다 . 

문법 

#include "mpi.h" 

int MPI_Type_extent( MPI_Datatype datatype, MPI_Aint 
^extent ) 

입 구파라메 터 

datatype : 자료형 ( 손잡이 ) 


줄구파라메 터 

extent : 자료형 범 위 ( 옹근수 ) 

- MPI_Type_size 

사용자정의형 에서 항목들이 차지 한 크기 ( 바이트단위)를 준다 . 
문법 

#include "mpi.h" 

int MPI_Type_size( MPI_Datatype datatype, int *size ) 


입 구파라메 터 

datatype: 자료형 ( 손잡이 ) 





줄구파라메 터 

size: 자료형크기 ( 옹근수 ) 

[실례 6.2] datatype 가 실례 6.1 에서 결정한 형 Type 를 취한다고 

하자 . 

이때 MPI_Type_extent(datatype, i) 는 i=16 을 주며 MPI_Type_size 
(datatype, i) 를 호출하면 i=9(8byte(double) + lbyte(char) = 9) 로 된다 . 

- MPI_Type_lb 

자료형의 아래한계를 돌려준다 . 

문법 

#include ” mpi.h” 

int MPI_Type_lb( MPI_Datatype datatype, MPI_Aint 

^displacement ) 

입구파라메터 

datatype: 자료형 ( 손잡이 ) 

줄구파라메 터 

displacement : 원천으로부터 아래한계의 변위 ( 바이트단위 )( 옹근수 ) 

- MPI_Type_ub 

자료형의 웃한계값을 돌려준다 . 

문법 

#include ’’mpi.h” 

int MPI_Type_ub( MPI_Datatype datatype, MPI_Aint 

^displacement ) 

입구파라메터 

datatype: 자료형 ( 손잡이 ) 

줄구파라메 터 

displacement: 원천으로부터 웃한계의 변위 ( 바이트단위 )( 옹근수 ) 


2. 형구축자 


2.1 련속자료형구축자 

- MPI_Type_contiguous 

련속적 인 자료형 을 창조한다 . 

문법 

#include "mpi.h" 

int MPI_Type_contiguous( int count, MPI_Datatype 

old_type, MPI_Datatype *newtype) 

입 구파라메 터 

count 복사개수(부아닌 옹근수 ) 
oldtype 낡은 자료형 ( 손잡이 ) 

줄구파라메 터 

newtype : 새 자료형 ( 손잡이 ) 

[실 례 6.3] oldtypes 가 대 역 18 count=3 인 형 {(double, 0), (char, 8)} 의 
넘기기를 취한다고 하자 . newtype 에 의하여 복귀한 datatype 형의 넘기기 
는 {(double, 0), (char, 8), (double, 16), (char, 24), (double, 32), (char, 
40)} 이 다 . 즉 double 및 char 요소들은 변위 0, 8, 16, 24, 32, 40 으로 련이 어 
놓인다 . 일반적으로 대역이 ex 인 형넘기기 

oldtype= {(typeO, disp0),---(typen-l, dispn-1)} 

이 있다고 하자 . 이때 newtype 는 다음과 같이 결정되는 count*n 개의 
요소로 이루어진 형넘기기를 취한다 . 

{(typeO, dispO), •■•(typen-1, dispn-1), (typeO, dispO+ex), •••(typen-1, 
dispn-l+ex), •••(typeO, disp0+ex*(count-1)), •••, (typen-1, dispn- 

l+ex*(count-l))} 


2.2 벡토르자료형의 구축자 


- MPI_Type_vector 

벡토르자료형을 창조한다 . 


문법 

#include "mpi.h" 

int MPI_Type_vector( int count, int blocklen, int stride, 
MPI_Datatype old_type, MPI_Datatype *newtype ) 

입 구파라메 터 

count 블로크개수(부아닌 옹근수 ) 

blocklen 매 블로크의 요소수(부아닌 옹근수 ) 
stride 매 블로크의 시작과 시작사이 거리 ( 요소수 ) 

oldtype 낡은자료형 ( 손잡이 ) 

줄구파라메 터 

newtype : 새 자료형 ( 손잡이 ) 

[실례 6.4] oldtype 가 대 역폭 16 을 가지고 형 {(double, 0), (char, 8)} 로 
넘기기된다고 하자 . 이때 MPI_Type_vector(2, 3, 4, oldtype, newtype) 를 
호출하면 다음과 같이 넘기기한 자료형 newtype 0 ! 생성된다 . 

{(double, 0), (char, 8), (double, 16), (char, 24), (double, 32), (char, 40), 
(double, 64), (char, 72), (double, 80), (char, 88), (double, 96), (char, 104)} 

때로는 우의 함수에서 파라메터 stride 를 요소수대신에 구체적인 
바이트수로 표현하면 더 편리할수 있다 . 아래 함수에서는 stride 률 
바이트수로 준다 . 

- MPI_Type_hvector 

바이 트변위 의 벡 토르자료형 을 창조한다 . 

문법 

#include "mpi.h" 

int MPI_Type_hvector( int count, int blocklen, MPI_Aint 


stride, MPI_Datatype old_type, MPI_Datatype *newtype ) 


입 구파라메 터 

count 블로크개수(부아닌 옹근수 ) 

blocklen 매 블로크에서의 요소수(부아닌 옹근수 ) 

stride 매 블로크의 시작과 시작사이 거리 ( 바이트단위 ) 

oldjype 낡은 자료형 ( 손잡이 ) 

줄구파라메 터 

newtype : 새 자료형 ( 손잡이 ) 

2.3 첨수화된 자료형구축자 

- MPI_Type_indexed 
첨수화된 자료형을 창조한다 . 

문법 

#include "mpi.h" 

int MPI_Type_indexed(int count, int blocklens[], int indices []， 
MPI_Datatype old_type, MPI_Datatype *newtype ) 


입 구파라메 터 

count 블로크개수 ( 옹근수)，첨수와 블로크길이배렬에서 항목의 수 

blocklens 매 블로크의 요소수(부아닌 옹근수배 렬 ) 
indices 낡은 형의 단위로 측정한 매 블로크의 변위 ( 옹근수배렬 ) 
oldjype 낡은 자료형 ( 손잡이 ) 

줄구파라메 터 

newtype : 새 자료형 ( 손잡이 ) 

[실례 6.5] oldtype 가 대 역폭 16 을 가지고 형 {(double, 0) ， (char, 8)} 로 
넘기기된다고 하자 . 그리고 B=(3, 1), D=(4, 0 ) 이라고 하자 . 
MPI_Type_indexed(2, B, D, oldtype, newtype ) 률 호출하면 다음과 같이 
넘기기되는 자료형 newtype 0 ! 생성된다 . 


{(double, 64), (char, 72), (double, 80), (char, 88), (double, 96), 
(char, 104), (double, 0), (char, 8)} 


아래의 실례는 사용자정의 자료형 이 행 렬의 웃삼각부분만을 전송하는데 
어떻게 리용되는가를 보여준다 . 

[실례 6.6] 


double a [100] [100] , disp[100], blocklen [100] ； 

MPI_Datatype upper ； 

/* 행렬에서 매 행의 시작과 크기 계산(대각선으로부터 시작 ) */ 
MPI_Type_indexed( 100, blocklen, disp, MPI_DOUBLE, &upper )； 
MPI_Type_commit(&upper )； 

/* 전송 */ 

MPI_Send(a, 1, upper, dest, tag, MPI_COMM_WORLD )； 


- MPI_Type_hindexed 

바이트변위의 첨수화된 자료형을 창조한다 . 

문법 

#include "mpi.h" 

int MPI_Type_hindexed(int count, int blocklens[], MPI_Aint 
indices[], MPI_Datatype old_type, MPI_Datatype *newtype ) 

입 구파라메 터 

count 블로크수 - 첨수와 블로크길이배렬에서 항목의 수 
blocklens 매 블로크의 요소수(부아닌 옹근수배렬 ) 
indices 매 블로크의 바이트변위 (MPI_Aint 배렬 ) 
oldjype 낡은 자료형 ( 손잡이 ) 

줄구파라메 터 

newtype : 새 자료형 ( 손잡이 ) 


[실례 6.7] oldtype 가 대 역폭 16 을 가지고 형 {(double, 0), (char, 8)} 로 
넘기기된다고 하자 . 그리고 B=(3, 1), D=(4, 0) 이라고 하자 . 
MPI_Type_hindexed(2, B, D, oldtype, newtype) 를 호출하면 다음과 같이 
넘겨지는 자료형 newtype 0 ! 생성된다 . 

{(double, 4), (char, 12), (double, 20), (char, 28), (double, 36), (char, 44), 
(double, 0), (char, 8)} 

2.4 구조적인 자료형구죽자 

- MPI_Type_struct 

구조화된 자료형을 창조한다 . 

문법 

#include "mpi.h" 

int MPI_Type_struct( int count, int blocklens[], MPI_Aint 
indices [] ， MPI_Datatype old_types [], MPI_Datatype *newtype ) 

입 구파라메 터 

count 블로크의 수 ( 옹근수 ) 
blocklens 매 블로크에서 요소의 수 ( 배렬 ) 
indices 매 블로크의 바이트변위 ( 배렬 ) 

old_types 매 블로크에서 요소의 형(자료형객체들에 대한 손잡이배렬 ) 

줄구파라메 터 

newtype : 새로운 자료형 ( 손잡이 ) 

[실례 6.8] typel 이 대 역폭 16 을 가지고 형 {(double, 0), (char, 8)} 로 
넘기기된다고 하자 . 그리고 B=(2, 1, 3), D=(0, 16, 26), T=(MPI_FLOAT, 
typel, MPI_CHAR) 이 라고 하자 . 

MPI_Type_struct(3, B, D, T, newtype) 를 호출하면 다음과 같이 넘기기 
되는 자료형 newtype 0 ! 생성된다 . 


{(float, 0), (float, 4), (double, 16), (char, 24), (char, 26), (char, 27), (char, 


28)} 

[실례 6.9] 구조행렬의 전송 


struct Partstruct 
{ char class ； 
double d [6] ； 
char b [7]; 


/* 요소의 클라스 */ 

/* 요소의 자리표 */ 

/* 일련의 보충정보 */ 


struct Parstruct particle [1000] ； 
int i, desk, rank ； 

MPI_Comm comm ； 

/* 구조체서 술자료형 구축 */ 

MPI 一 Datatype Particletype ； 

MPI_Datatype type [引 = {MPI—CHAR ， MPI_DOUBLE, MPI_CHAR) ； 
int blocklen[3] = {1, 6, 7} ； 

MPI_Aint disp[3] = {0, sizeof(double), 7*sizeof(double)} ； 

/* 자료형 구죽 */ 

MPI_Type_struct(3, blocklen, disp, type, &Particletype )； 
MPI_Type_commit(&Particletype )； 

/* 행렬요소들을 전송 */ 

MPI_Send(particle, 1000, Particletype, dest, tag, comm )； 


3. 사용자자료형의 리용 

3.1 형넘기기와 해방 


- MPI_Type_commit 


사용자정 의 자료형 의 사용시 작을 선 언 한다 . 


문법 

#include ’’mpi.h” 

int MPI_Type_commit( MPI_Datatype *datatype ) 


입구파라메터 

datatype : 자료형 ( 손잡이 ) 

- MPI_Type_free 

사용자가 정의한 자료형을 해방한다 . 

문법 

#include ” mpi.h” 

int MPI_Type_free( MPI_Datatype *datatype ) 

입구파라메터 

datatype : 해방할 자료형 ( 손잡이 ) 

[실례 6.10.] MPI_Type_commit 와 MPI_Type_free 함수의 리용실례 


int typel, type2 ； 

MPI_Type_contuguous(5, MPI—FLOAT<&typel )； 

/* 새형의 객체창조 */ 


MPI_T ype_commit(&type 1) ； 

/* 새 typel 은 자료교환에 리 용할수 있다 . */ 


type2=typel; 


/* type2 를 자료교환에 리 용할수 있다 . */ 
MPI_Type_vector(3, 5, 4, MPI_FLOAT, &typel )； 

/* 새형의 객체창조 */ 


MPI_Type_commit(&typel )； 

/* 새 typel 은 교환에 리용할수 있다 . */ 
MPI_Type_free(&type2 )； /* 형의 해방 */ 


type2=typel; /* type2 는 자료교환에 리용가능 */ 

MPI_Type_free(&type2 )； 

/*typel, type2 는 사용불가능 ; type2 는 
MPI_DATATYPE_NULL, typel 은 미결정 */ 


- MPI_Get_count 
” 웃준위”요소의 수를 얻는다 . 

문법 

#include "mpi.h" 

int MPI_Get_count(MPI_Status ^status, MPI_Datatype datatype, 

int *count ) 

입 구파라메 터 

status 수신연산의 복귀상태 ( 상태 ) 
datatype 매 완충기 요소의 자료형 ( 손잡이 ) 

줄구파라메 터 

count : 수신된 요소의 수 ( 옹근수 ) 

3.2 통보길이를 주는 함수와 주소함수 
- MPI_Get_elements 

자료형 에서 기초자료형요소의 수를 돌려준다 . 

문법 

#include "mpi.h" 

int MPI_Get_elements( MPI_Status ^status, MPI_Datatype 

datatype, int ^elements ) 

입 구파라메 터 

status 수신연산의 복귀상태 ( 상태 ) 
datatype 수신 연산에 리 용된 자료형 (손잡이 ) 


줄구파라메 터 


count : 수신된 기 초형 의 요소수 ( 옹근수 ) 


[실례 6.11] MPI_Get_count 와 MPI_Get_element 의 리 용 

MPI_Type_contiguous(2, MPI_FLOAT, &type2 )； 
MPI_Type_commit(&type2 )； 

MPI_Comm_rank(comm, &rank )； 
if (rank == 0) { 

MPI_Send(a, 2, MPI—FLOAT, 1, 0, comm )； 

MPI_Send(a, 3, MPI—FLOAT, 1, 1, comm )； 

} 

else { 

MPI_Recv(a, 2, type2, 0, 0, comm, &start )； 
MPI_Get_count(start, type2, &I )； /* i=l 을 복귀 */ 
MPI_Get_element(start, type2, &I )； /* i=2 를 복귀 */ 
MPI_Recv(a, 2, type2, 0, 1, comm, &start )； 
MPI_Get_count(start, type2, &I )； 

/* i=MPI_UNDEFINED 을 복귀 */ 
MPI_Get_element(start, type2, &I )； /* i=3 을 복귀 */ 


- MPI_Address 

기억기에서 위치주소를 얻는다 . 


문법 

#include ” mpi.h” 

int MPI_Address( void *location, MPI_Aint *address) 
입구파라메터 

location: 호출자 ( 프로쎄스)기억기에서 위치 

줄구파라메 터 

address : 위치의 주소 


[실례 6.12] 행렬에 MPI_Address 함수를 
sizeof(float) 이고 il, i2 값은 실행과 관련된다. 


리 용， 


DIFF?^ 909* 


float a [100] [100]; 
int il, i2, DIFF； 

MPI_Address(a, &il)； 

MPI_Address(a[9] [9], &i2)； 

DIFF=i2-il； 

[실례 6.13] 우의 실례에서 구조적의존성을 피하기 위한 코드변경 
구조체요소들의 변위를 계산하기 위하여 MPI_Address 함수를 호출한다. 


struct Partstruct { 
char class； /* 요소의 클라스 */ 

doubled[6]; /* 요소의 자리표 */ 

char b [7] ； /* 일련의 보충정 보 */ 


struct Parstruct particle [1000] ； 
int i, desk, rank； 

MPI_Comm comm； 

MPI_Datatype type [3] = {MPI—CHAR, MPI_DOUBLE, MPI_CHAR}; 
int blocklen [3] = {1，6, 7} ； 

MPI_Aint disp [引 ; 

/* 변위계산 */ 

MPI_Address(particle, &disp [0] )； 

MPI_Address(particle [0], &disp [ 1 ]); 

MPI_Address(particle [1], &disp [2] )； 
for (i=2; i〉=0; i--) 
disp [i] -=disp [0] ； 

/* 자료형 구축 */ 

MPI_Type_struct(3, blocklen, disp, type, &particletype)； 
MPI_Type_commit(&particletype)； 


/* 행렬원소들을 전송 */ 

MPI_Send(particle, 1000, particletype, dest, tag, comm )； 


[실례 6.14] 우의 실례 7.8 에서 프로그람이 particletype 의 대역을 정확히 
설정하도록 다음과 같이 변경시킨다 . 


struct Partstruct { 
char class ； /* 요소의 클라스 */ 

doubled[6]; /* 요소의 자리표 */ 

char b [7] ； /* 일 련의 보충정 보 */ 



struct Parstruct particle [1000] ； 
int i, desk, rank ； 

MPI_Comm comm ； 

MPI 一 Datatype particletype ； 

MPI_Datatype type [3] = {MPI_CHAR, 

MPI_DOUBLE, MPI_CHAR, MPI_UB} ； 
int blocklen [4] = {1 ， 6, 7, 1) ； 

MPI_Aint disp[4]; 

/* 구조요소들의 변위계산 */ 

MPI_Address(particle, &disp [0] )； 

MPI_Address(particle [0] .d, &disp [ 1 ]); 
MPI_Address(particle [0] .b, &disp [2] )； 
MPI_Address(particle [ 1 ] .b, &disp [3] )； 


for (i=3; i 〉 =0; i—) 
disp [i] - =disp[0] ； 

/* 자료형 구죽 */ 

MPI_Type_struct(4, blocklen, disp, type, &particletype )； 
MPI_Type_commit(&particletype )； 


/* 행 렬요소들을 전송 */ 

MPI_Send(particle, 1000, particletype, dest, tag, comm )； 


4. 자료의 묶기와 풀기 

- MPI_Pack 

련속적 인 기 억구역으로 자료형을 묶는다 . 

문법 

#include "mpi.h" 

int MPI_Pack(void *inbuf, int incount, MPI_Datatype datatype, 
void *outbuf, int outcount, int ^position, MPI_Comm comm ) 

입 구파라메 터 

inbuf 입 구완충기 시 작(선 택 ) 
incount 입구자료항목개수 ( 옹근수 ) 
datatype 매 입 구자료항목의 자료형 ( 손잡이 ) 
outcount 바이 트단위 의 출구완충기 크기 ( 옹근수 ) 
position 완충기에서의 현재 위치 ( 옹근수형지적자 ) 
comm 묶어진 통보률 위한 통신기 ( 손잡이 ) 

줄구파라메 터 

outbuf : 출구완충기 의 시 작주소 ( 선택 ) 

- MPI_Pack_size 

통보를 묶는데 필요한 공간크기의 웃한계값을 준다 . 

문법 

#include "mpi.h" 

int MPI_Pack_size( int incount, MPI_Datatype datatype, 

MPI_Comm comm, int *size ) 


입 구파라메 터 


hicount 묶기호출에서의 파라메터개수 ( 옹근수 ) 
datatype 묶기 호출에서 의 파라메 터 들의 형 (손잡이 ) 
comm 묶기호출에서의 통신기 ( 손잡이 ) 


줄구파라메 터 

size : 묶어진 통보크기의 웃한계 ( 바이트단위 )( 옹근수 ) 

- MPI_Unpack 

련속기 억 구역 에로 자료형 을 풀기 한다 . 

문법 

#include "mpi.h" 

int MPI_Unpack( void *inbuf, int insize, int ^position, 

void *outbuf, int outcount, MPI_Datatype datatype, 

MPI_Comm comm ) 

입 구파라메 터 

inbuf 입 구완충기 시 작(선 택 ) 

insize 입구완충기의 바이트크기 ( 옹근수 ) 
position 현재 위치 ( 옹근수형지적자 ) 
outcount 풀어 야 할 항목개 수 ( 옹근수 ) 
datatype 매 출구자료항목의 자료형 ( 손잡이 ) 
comm 묶은 통보에 대한 통신기 ( 손잡이 ) 

줄구파라메 터 

outbuf : 출구완충기 의 시 작주소 
[실례 6.15] 다음의 두 프로그람은 동일한 통보를 발생한다 . 
int i ； 

char c [100] ； 
int disp [2] ； 

int blocklen [2] = {1, 100} ； 

MPI_Datatype type [2] = {MPIJNT, MPI_CHAR} ； 


MPI_Datatype Type ； 

/* 자료형 구축 */ 

MPI_Address(&i, &disp[0]); 

MPI_Address(c, &disp[l]); 

MPI_Type_struct(2, blocklen, disp, type, &Type )； 

MPI_T ype_commit(&T ype )； 

/* 전송 */ 

MPI_Send(MPI_BOTTOM, 1, Type, 1, 0, MPI_COMM_WORLD )； 

자료묶기 를 진 행 한다 . 
int i ； 

char c [100] ； 
char buffer [110] ； 
int position = 0 ； 

/* 묶기 */ 

MPI_Pack(&i, 1, MPIJNT, buffer, 110, 

&position, MPI_COMM_WORLD )； 
MPI_Pack(c, 100, MPI_CHAR, buffer, 110, 

&position, MPI_COMM_WORLD )； 

/* 전송 */ 

MPI_Send(buffer, position, MPI_PACKED, 

1, 0, MPI_COMM_WORLD )； 

[실례 6.16] 우의 실례에서 보낸 자료를 받는 ( 푸는 ) 프로그람 
int i ； 

char c [100] ； 

MPI_Status status ； 
int disp[2] ； 

int blocklen [2] = {1, 100} ； 

MPI_Datatype type [到 = {MPIJNT, MPI_CHAR} ； 

MPI_Datatype Type ； 

/* 자료형 구죽 */ 

MPI_Address(&i, &disp [0] )； 


MPI_Address(c, &disp[l]); 

MPI_Type_struct(2, blocklen, disp, type, &Type )； 

MPI_T ype_commit(&T ype )； 

/* 수신 */ 

MPI_Recv(MPI_BOTTOM, 1, Type, 0, 

0, MPI_COMM_WORLD, &status )； 

자료풀기 를 진 행 한다 . 
int i ； 

char c [100] ； 

MPI_Status status ； 
char buffer [110] ； 
int position = 0 ； 

/* 수신 */ 

MPI_Recv(buffer, 110, MPI_PACKED, 1, 0, 

MPI_COMM_WORLD, &status )； 

/* 풀기 */ 

MPI_Unpack(buffer, 110, &position, &i, 1, MPI_INT, MPI_COMM_ 
WORLD )； 

MPI_Unpack(buffer, 110, &position, c, 100, MPI_CHAR, MPI_COMM. 
WORLD )； 


제 7 절 환경조종 


i. 실행과 관련한 정보 

MPI 실행환경을 서술하는 속성들은 MPI 를 초기화한 후에 통신기 
MPI_COMM_WORLD 에 련결된다 . 이 속성들을 제거하거나 값들을 변경 
하는것은 오유이다 . 

미 리 정의되 여있는 기본속성들은 다음과 같다 . 

MPI_TAG_UB - 표적 값의 웃한계 



MPI_HOST - 주프로쎄스 (host ) 의 번호，만일 없으면 MPI_PROC_NULL 로 
된 다 . 

MPIJO - 표준입출구마디의 번호(호출프로쎄스의 번호도 가능 ) 

같은 통신기의 마디들은 이 파라메터값들을 각이하게 줄수 있다 . 
MPI_WTIME_ISGLOBAL - 시 계들이 동기 화되 였는가를 지 적 하는 론리 변수 

이 미리 정의된 속성들은 MPI 실행환경초기화 (MPIJnit) 및 MPI 실행 
환경끝내기 (MPI_Finalize ) 의 값들을 변화시키지 않는다 . 

먼저 처 리기이름을 얻는 함수에 대하여 보기로 한다 . 

- MPI_Get_processor_name 
처리기의 이름을 얻는다 . 

문법 

#include "mpi.h" 

int MPI_Get_processor_name(char *name, int *resultlen) 

줄구파라메 터 

name 현존 물리적마디점에 대한 단일식별자 

적어도 MPI_MAX_PROCESSOR_NAME 크기의 배렬이여야 
한다 . 

resultlen 이 름 ( 문자렬)의 길 이 
2. 계수기와 동기화 

MPI 는 계수기를 결정한다 . 

병렬프로그람에서 시간선택이 오유수정 등에서 매우 중요하고 또한 
현존 계수기들 (POSIX 에서 1003.1-1988, 1003.4D 14.1 등)이 쓰기 불편 
하고 고가용성계수기들에 상응한 호출을 하지 못함으로 계수기가 리용된다 . 

- MPI_Wtime 

호줄한 처 리 기 에 서 경 과된 시 간을 돌려 준다 . 


문법 


#include "mpi.h" 
double MPI_Wtime() 


귀환값 

이전의 어떤 시각으로부터 경과된 시간을 초단위로 돌려준다 . “이전 
시간 ” 은 프로쎄스가 살아있는 동안은 변하지 않는다 . 

- MPI_Wtick 

MPI_Wtime 의 분해능을 돌려준다 . 


문법 

#include "mpi.h" 
double MPI_Wtick() 


귀환값 

경과한 시간을 초단위로 하는 분해 능 
3. 초기화와 완료 

MPI 에서 기본목적의 하나는 MPI 원천코드들의 이식가능성을 보장하는 
데 있다 . 이것은 프로그람이 MPI 를 리용하고 표준언어코드를 실행하면서 
작성 한 그 형 태로 이식가능하여 야 하며 다른 체계로 이식할 때 원천코드 
률 조금도 변경시키지 말아야 한다는것을 의미한다 . 이것은 MPI 프로 
그람을 지령행에 의하여 시작하거나 끝내지 말아야 하며 MPI 프로그람이 
실행되는 환경을 사용자가 변경시키지 않도록 해야 한다는것이다 . 대신 
다른 MPI 함수들을 호출하기전에 일련의 설정을 하여야 한다 . 이 함수가 
MPIJnit 함수이며 모든 MPI 프로그람은 이 함수호출로부터 시작된다 . 
MPI_Finalize 함수는 모든 MPI 설정을 해제한다 . 


- MPIJnit 

MPI 실행환경을 초기화한다 . 
문법 

#include "mpi.h" 


int MPI_Init(int *argc，char ***argv) 


입 구파라메 터 

argc 파라메 터 개 수 지 적 자 
argv 파라메 터 벡 토르지 적 자 

- MPI_Finalize 
MPI 실행환경을 끝낸다 . 

문법 

#include "mpi.h" 
int MPI_Finalize() 


설명 

모든 MPI 프로쎄스는 끝나기전에 이 루린을 반드시 호출해야 한다 . 이 
함수가 호출된 후에는 어떤 MPI 함수도 호출하지 말아야 한다 . 따라서 
MPI_Finalize 를 호출한 후에는 return 을 호출하는것외 에 더 다른것을 하지 
말아야 한다 . 

- MPIJnitialized 

MPIJnit 가 호출되였는가 아닌가를 검사한다 . 


문법 

#include "mpi.h" 

int MPI_Initialized( int *flag ) 

줄구파라메 터 

flag : MPIJnit 가 호출되 였으면 참 아니면 거짓 이다 . 

- MPI_Abort 
MPI 프로세스들을 끝낸다 . 


문법 

#include "mpi.h" 


int MPI_Abort( MPI_Comm comm, int errorcode) 


입 구파라메 터 

comm : 중지 시 키려는 과제 들의 통신 기 

errorcode : 현재의 가동환경 에 반환하는 오유코드 

설명 

대부분 체계에서 통신기 comm 에 속한 모든 MPI 프로쎄스들을 끝낸다 . 

- MPI_Get_version 
MPI 의 판본을 얻는다 . 

문법 

#include "mpi.h" 

int MPI_Get_version( int ^version, int ^subversion ) 

줄구파라메 터 

version MPI 의 기본판본 (1 또는 2) 

Subversion MPI 의 부분판본 

설명 

정의된 값 MPI_VERSION 과 MPI_SUBVERSION 들은 같은 정보를 포함 
한다 . 이 루린들은 mpi.h 와 mpif.h 에서 서고가 판본과 일치하는가률 검사 
한다 . 

4. 오유처리함수들 

MPI 는 사용자에게 안전한 통보전송을 제공한다 . 그러나 만일 MPI 
응용프로그람실 행 환경 이 비 정 상적 으로 구축되 여있 다면 MPI 병 렬 계 산환경 
구축자들은 가능한 오유들을 처리하여 야 한다 . MPI 는 MPI 호출시 에 만나게 
되 는 일련의 오유들을 처 리할수 있다 . 


4.1 오유처리기 


사용자는 오유처리기를 통신기와 련결할수 있다 . MPI 에는 미리 정의된 
다음의 몇가지 오유처리기가 있다 . 

- MPI_ERRORS_ARE_FATAL : 이 오유처리기는 실행중의 모든 
프로쎄 스들을 중지시 킨다 . 이 것은 MPI_Abort 함수를 동신기파라메터를 
MPI_COMM_WORLD 로 지정하여 호출한것과 같다 . 

- MPI_ERRORS_RETURN : 사용자에게 오유코드률 주는것외에 그 어떤 
작용도 없다 . 

MPI 는 새 오유처리기를 창조하고 그것을 통신기와 련결하거나 삭제 
하는 함수들을 제공한다 . 


- MPI_Errhandler_create 
MPI 형 오유처리기를 창조한다 . 

문법 

#include "mpi.h" 

int MPI_Errhandler_create(MPI_Handler_function ^function, 

MPI_Errhandler *errhandler) 


입 구파라메 터 

function : 사용자정의오유처 리 함수 
줄구파라메 터 

errhandler : MPI 오유처 리 기 ( 손잡이 ) 

- MPI_Errhandler_free 
MPI 형 오유처 리 기 를 해 방한다 . 

문법 

#include "mpi.h" 

int MPI_Errhandler_free( MPI_Errhandler *errhandler ) 

입 구파라메 터 

errhandler : MPI 오유처 리 기 ( 손잡이 ) 


탈퇴시 MPI_ERRHANDLER_NULL 로 된다 . 


- MPI_Errhandler_get 

통신기에 련결된 오유처리기를 얻는다 . 

문법 

#include "mpi.h" 

int MPI_Errhandler_get( MPI_Comm comm, MPI_Errhandler 

*errhandler ) 

입구파라메터 

comm : 오유처리기를 얻으러는 통신기 ( 손잡이 ) 

줄구파라메 터 

errhandler : 현존 통신기와 련결된 MPI 오유처리기 ( 손잡이 ) 

- MPI_Errhandler_set 

오유처리기를 통신기에 설정한다 . 

문법 

#include "mpi.h" 

int MPI_Errhandler_set( MPI_Comm comm, MPI_Errhandler 

errhandler ) 


입 구파라메 터 

comm 오유처리기를 설정하여야 할 통신기 ( 손잡이 ) 

errhandler 새 로운 MPI 오유처 리 기 ( 손잡이 ) 

4.2 오유코드들 

모든 MPI 함수들은 성공적으로 실행 (MPI_SUCCESS) 혹은 MPI 오유 
클라스와 관련한 정보를 얻기 위한 코드를 귀환한다 . MPI 함수가 몇가지 
각이한 연산들에 의하여 끝나 몇개의 독립적인 오유가 발생하면 MPI 
함수는 다중오유코드를 준다 . 


- MPI_Error_string 

주어진 오유코드에 대한 문자렬을 복귀한다 . 

문법 

#include "mpi.h" 

int MPI_Error_string( int errorcode, char ^string, int 

*resultlen ) 


입 구파라메 터 

errorcode : MPI 함수 또는 MPI 오유클라스에 의 해 귀환되는 오유코드 
줄구파라메 터 

string 오유코드에 대응되는 본문 
resultlen 문자렬의 길 이 

- MPI_Error_class 

오유코드를 오유클라스로 변환한다 . 매 오유코드를 표준오유코드(오 
유클라스)로 넘기고 다음에는 매개 표준오유코드률 자기에게로 넘긴다 . 

문법 

#include "mpi.h" 

int MPI_Error_class( int errorcode, int *errorclass) 

입 구파라메 터 

errorcode: MPI 함수에 의해 복귀된 오유코드 
줄구파라메 터 

errorclass : 오유코드와 관련되는 오유클라스 

A MPI 오유클라스는 다음과 같다 . 

MPI_SUCCESS 오유없음 

MPI_ERR_BUFFER 완충기 지 적 자오유 


MPI_ERR_COUNT 

MPI_ERR_TYPE 

MPI_ERR_TAG 

MPI_ERR_COMM 

MPI_ERR_RANK 

MPI_ERR_REQUEST 

MPI_ERR_ROOT 

MPI_ERR_GROUP 

MPI_ERR_OP 

MPI_ERR_TOPOLOGY 

MPI_ERR_DIMS 

MPI_ERR_ARG 

MPI_ERR_UNKNOWN 

MPI_ERR_TRUNCATE 

MPI_ERR_OTHER 

MPI_ERR_INTERN 

MPI_ERR_IN_STATUS 

MPI_ERR_PENDING 

MPI_ERR_LASTCODE 


개 수파라메 터 오유 
자료형파라메터오유 
표적파라메터오유 
통신기 오유 
프로쎄스번호오유 
틀린 요구 
뿌리 오유 
그룹오유 
연산자오유 
위상오유 

데 카르트구조파라메 터 오유 
자료형불일치오유 
알수 없는 오유 
수신시 통보가 잘리우는 오유 
목록에 없는 오유 
MPI 내부오유 
상태 오유코드 
요구미결 
마지 막오유코드 



제 3 장 MPI 프로그람작성실기 


제 1 절 기 초위 상 MPI _ COMM_WORLD 에 서 의 

프로그람작성 


이 절의 목적은 완전그라프인 기초위상 MPI_COMM_WORLD 에서 병렬 
프로쎄 스들의 호상작용수법 을 습득하는데 있 다. 

[실례 1] hello.c 
- 프로그람의 작성 

#include <stdio.h> 

#include ’’mpi.h” 


main(int argc, char **argv) 

{ 

MPI_Init(&argc, &argv)； 
printf("Hello, world\n”); 
MPI_Finalize()； 
return 0； 


- 프로그람을 콤파일 
〜〉 mpicc -o hello hello.c 

만일 오유가 있으면 편집 기 에서 프로그람을 수정한다. 


- 프로그람의 실행 



~> mpirun -np 4 hello 


화면에는 다음과 같은 결과가 현시된다 . 

Hello, world 
Hello, world 
Hello, world 
Hello, world 

지령행에서 4 라는것은 4 개의 독립적인 프로쎄스에서 프로그람을 실행 
한다는것을 의미한다 . 즉 프로그람은 4 개의 가지로 되 여있다 . 앞으로 
“ 병렬프로쎄스 ” 와 “병렬프로그람의 가지 ” 를 같은 말로 취급한다 . 

mpirun 의 의미를 보면 다음과 같다 . 프로그람 hello 는 이미 구축된 
4 개의 가상콤퓨터들에 실행전에 복사되며 매 복사된 프로그람을 실행한다 . 

[실례 2] 병렬프로그람의 매개 가지는 병렬프로쎄스의 식별번호와 크기 즉 
병 렬프로그람의 매개 가지 가 들어있는 가상를류터 의 수를 화면 에 출력 한다 . 

#include <stdio.h> 

#include "mpi.h" 

main(int argc, char **argv) 

{ 

int size, rank ； 

MPI_Init(&argc, &argv )； 

MPI_Comm_size(MPI_COMM_WORLD, &size )； 
MPI_Comm_rank(MPI_COMM_WORLD, &rank )； 
printf("size=%d, rank=%d\n", size, rank )； 

MPI_Finalize ()； 
return 0 ； 


프로그람을 콤파일하고 실행시키는 과정은 우의 실례에서와 같다 . 


[실례 引 0 번 프로쎄스는 7 번 프로쎄스에 통보(이 경우에는 식별자)를 보 
낸다. 7 번 프로쎄스는 자기의 식별자와 0 번 프로쎄스로부터 받은 식별자 
를 화면에 출력한다. 

#include <stdio.h> 

#include "mpi.h" 

main(int argc, char **argv) 

{ 

int size, rank, r； 

MPI_Status status； 

MPI_Init(&argc, &argv)； 

MPI_Comm_size(MPI_COMM_WORLD, &size)； 
MPI_Comm_rank(MPI_COMM_WORLD, &rank)； 

if (rank == 0) 

MPI_Send(&rank, 1, MPI_INT, 7, 2, MPI_COMM_WORLD)； 
else 

if (rank == 7) { 

MPI_Recv(&r, 1, MPIJNT, 0, 2, MPI_COMM_WORLD, 

&status)； 

printf("process=%d r=%d\n", rank, r)； 


MPI_Finalize()； 
return 0； 


[실례 4] 0 번 프로쎄스는 1 번 프로쎄스에 통보(자기의 식별자)를 보내고 
1 번 프로쎄스는 2 번 프로쎄스에 받은 번호를 보내며 2 번 프로쎄스는 
받은 번호를 3 번 프로쎄스에로 보내는 등 사슬을 따라 번호증가방향으로 


계속한다. 마지막으로 0 번 프로쎄스는 size-1 번 프로쎄스로부터 번호를 
받아 화면에 자기의 번호와 수신된 정보를 출력한다. 즉 정보률 콤퓨터 
“고리” 를 따라 전달한다. 


#include <stdio.h> 

#include "mpi.h" 

main(int argc, char **argv) 

{ 

int size, rank, r； 
MPI_Status status； 


MPI_Init(&argc, &argv)； 

MPI_Comm_size(MPI_COMM_WORLD, &size)； 
MPI_Comm_rank(MPI_COMM_WORLD, &rank)； 
if (rank == 0) { 

MPI_Send(&rank, 1, MPI_INT, rank+1, 2, MPI_COMM_WORLD)； 
MPI_Recv(&r, 1, MPI_INT, size-1, 2, MPI_COMM_WORLD, 
&status)； 

printf("process= %d r-%d\n", rank, r)； 

} 

else { 

MPI_Recv(&r, 1, MPI_INT, rank-1, 2, MPI_COMM_WORLD, 
&status)； 

MPI_Send(&r, 1, MPI_INT, (rank+l)%size, 2, 
MPI_COMM_WORLD)； 

} 

MPI_Finalize()； 
return 0； 



제 2 절 각이한 위상들에서의 프로그람작성 


목적 : 데카르트위상과 “그라프” 위상에서 실행되는 MPI 프로그람들을 
작성하는데 있다. 

[실례 5] 병렬체계의 모든 가지들은 콤퓨터자리표증가방향으로 린접가지 
들에 자료를 전송한다. 

#include <stdio.h> 

#include <stdlib.h> 

#include "mpi.h" 


■fine DIMS 2 

main(int argc, char **argv) 

{ 

int size, rank, i, A, B, dims [DIMS] ； 

int periods [DIMS], sourcl, sourc2, destl, dest2； 

int reorder = 0； 

MPI_Comm comm_cart； 

MPI_Status status； 

MPI_Init(&argc, &argv)； 

/* 매 프로쎄스는 프로쎄스의 총개수를 알아낸다. */ 

MPI_Comm_size(MPI_COMM_WORLD, &size)； 

/* 그리고 자기의 번호를 알아낸다. */ 

MPI_Comm_rank(MPI_COMM_WORLD, &rank)； 

A = rank; 

B=-l; 

/* dims 배 렬을 초기 화하고 배 렬 periods 을 “2 차원” 위 상으로 채 운다. */ 
for (i=0； i<DIMS； i++) { 
dims [i] =0; 
periods [i] =1; 


/* 살창의 크기를 지 적하는 dims 배 렬을 채운다. */ 

MPI_Dims_create(size, DIMS, dims)； 

/* 통신기 comm_cart 를 가진 “2 차원” 위상을 생성한다. */ 

MPI_Cart_create(MPI_COMM_WORLD, DIMS, dims, periods, 
reorder, &comm_cart)； 

/* 매 프로쎄스는 자리표의 큰값방향으로 자리표를 따라 린접가지들을 
찾는다. */ 

MPI_Cart_shift(comm_cart, 0, 1, &sourcl, &destl)； 
MPI_Cart_shift(comm_cart, 1, 1, &sourc2, &dest2)； 

/* 매 프로쎄스는 자기의 자료(변수 A 의 값)를 자리표의 큰 값을 취하는 
린접프로쎄스들에 전송하고 “고리” 를 따라 자리표의 작은 값을 취하는 
린접가지로부터 자료를 받아 B 에 넣는다. */ 

/* 매 프로쎄스는 자기의 번호(이 번호를 린접프로쎄스에 전송)와 변수 
B 의 값(린접프로쎄스의 번호)을 출력한다. */ 

MPI_Sendrecv(&A, 1, MPI_INT, destl, 2, &B, 1, MPI_INT, sourcl, 
2, comm_cart, &status)； 

printf(’’rank= %d B=%d\n", rank, B)； 

MPI_Sendrecv(&A, 1, MPI_INT, dest2, 2, &B, 1, MPI_INT, sourc2, 
2, comm_cart, &status)； 

printf(’’rank= %d B=%d\n", rank, B)； 

/* 모든 프로쎄스들은 위상 comm_cart 와 련관된 모든 프로쎄스들을 완료 
하고 프로그람을 끝낸다. */ 

MPI_Comm_free(&comm_cart)； 

MPI_Finalize()； 
return 0； 

} 

[실례 6] 실례 4 와 비슷하지만 위상을 리용한다. 0 번 프로쎄스는 콤퓨터 
“고리” 률 따라 자료전송을 시작하며 전송되는 자료들은 모든 콤퓨터 
들을 따라 순차적 으로 “통과하여 ” 0번 프로쎄 스를 실 행 하는 0번 콤퓨터 
로 돌아온다. 


#include <stdio.h> 
#include <stdlib.h> 


#include "mpi.h" 


#define DIMS 1 

main(int argc, char **argv) 

{ 

int size, rank, i, A, B, dims [DIMS] ； 
int periods [DIMS], source, dest； 
int reorder = 0； 

MPI_Comm comm_cart； 

MPI_Status status； 


MPI_Init(&argc, &argv)； 

/* 매 프로쎄스는 프로쎄스의 총개수를 알아낸다. */ 

MPI_Comm_size(MPI_COMM_WORLD, &size)； 

/* dims 배렬을 초기화하고 배렬 periods 을 “2 차원” 위상으로 채운다. */ 
for (i=0;i < DIMS； i++) { 
dims [i] =0; 
periods [i] =1; 

} 

/* 살창의 크기 를 지 적 하는 dims 배 렬을 채운다. */ 

MPI_Dims_create(size, DIMS, dims)； 

/* 통신기 comm_cart 를 가진 “고리 ” 형위상을 생성 한다. */ 

MPI_Cart_create(MPI_COMM_WORLD, DIMS, dims, periods, reorder, 
&comm_cart)； 

/* 자기의 번호를 알아낸다. */ 

MPI_Comm_rank(MPI_COMM_WORLD, &rank)； 

A=rank; 

B=-l; 

/* 매 프로쎄스는 고리를 따라 번호가 큰방향으로 자기의 이웃들을 찾는다. 

*/ 

MPI_Cart_shift(comm_cart, 0, 1, &source, &dest)； 

/* 0 번 프로쎄스는 고리를 따라 자료(자기번호)를 전송하며 size-1 번 
프로쎄 스로부터 이 값을 받는다. */ 



if (rank == 0) { 

MPI_Send(&A, 1, MPI—INT, dest, 12, comm_cart)； 
MPI_Recv(&B, 1, MPI-INT, source, 12, comm_cart, &status)； 
printf(’’rank=%d B=%d\n”, rank, B)； 

} 

/* 기타 모든 나머지 프로쎄스들에서의 동작 */ 
else { 

MPI_Recv(&B, 1, MPI-INT, source, 12, comm_cart, &status)； 
MPI_Send(&B, 1, MPI_INT, dest, 12, comm_cart)； 

} 

/* 완료작업 */ 

MPI_Comm_free(&comm_cart)； 

MPLFinalizeO； 
return 0； 


[실례 7] N 개의 콤퓨터들로 “별” 형위상을 구성한다. 여기서 0 번콤퓨터 
는 뿌리프로쎄스이고 “잎” 들은 아래 그림과 같이 련결되며 고리를 이룬 
다. 뿌리프로쎄스는 “잎” 들에 자료를 보내고 또 그것들은 수신된 자료를 
처리하여 뿌리프로쎄스로 보낸다. 뿌리프로쎄스는 일련의 정보를 출력한다. 

“잎” 들에서는 임의의 위상을 구성할수 있는데 이 실례의 경우에는 
“고리” 위상이다. 



#include <stdio.h> 
#include <stdlib.h> 



#include ” mpi.h” 


#define DIMS 1 

main(int argc, char **argv) 

{ 

int size, sizel, rankgr, i, v, j, key, color, A, *B, C； 

int periods [DIMS], dims [DIMS], *index, *edges, source, dest, D[2] ； 

int reorder = 0； 

MPI_Comm comm_cart, comm_gr, comm_0, comm_l； 

MPI_Status st； 


MPI_Init(&argc, &argv)； 

/* 매 프로쎄스는 프로쎄스의 총개수를 알아낸다. */ 
MPI_Comm_size(MPI_COMM_WORLD, &size)； 

/* 그라프위상에서 정점과 호를 서술하기 위한 배렬기억할당 */ 
index=(int *)malloc(size*sizeof(int))； 
edges=(int *)malloc((size-l)*(size-l)*3*sizeof(int))； 

/* 그라프위상의 정점과 호를 서술하기 위한 배렬의 값을 

넣고 “그라프” 위상을 제시 한다. */ 
index [0] =size-l; 

for (i=0; i<size-l； i++) edges [i] =i+l; 
v=0; 

for (i=l;i<size;i++) { 

index [i] =(size-l)+i*3; 
edges [(size-l)+v++] =0; 

edges [(size- l)+v++] =((i-2)+(size- l))%(size-1)+1 ； 
edges [(size-l)+v++] =i%(size-l)+l； 

} 

MPI_Graph_create(MPI_COMM_WORLD, size, index, edges, reorder, 
&comm_gr)； 

/* 매 프로쎄 스는 자기 의 번호를 식 별한다. */ 

MPI_Comm_rank(comm_gr, &rankgr)； 
if (rankgr == 0) { 



color=MPI_UNDEFINED; 

key=0; 

MPI_Comm_split(comm_gr, color, key, &comm_0)； 

} 

else { 
color=l; 
key=rankgr; 

MPI_Comm_split(comm_gr, color, key, &comm_l)； 

} 

/* 매 프로쎄스는 comm_l 에서 의 자기번호를 식 별한다. */ 
MPI_Comm_size(comm_l , &sizel)； 

/* comm_l 에서 이제는 “고리” 형위상 comm_cart 를 생성한다. */ 

/* 배렬 dims 를 초기화하고 “고리” 형위상을 위한 배렬 periods 에 
값을 넣 는다. */ 
for (i=0; i < DIMS； i++) { 
dims[i]=0; 
periods [i] =0; 

} 

/* (1 차원)살창의 크기를 지정하는 배렬 dims 에 값을 넣기 */ 
MPI_Dims_create(size 1, DIMS, dims)； 

/* “고리 ” comm_cart 를 가진 “고리 ” 형 위 상을 생 성한다. */ 

MPI_Cart_create(comm_l, DIMS, dims, periods, reorder, 
&comm_cart)； 

/* 매 프로쎄스는 고리를 따라 번호가 커지는 방향으로 이웃프로쎄스를 
찾는다. */ 

MPI_Cart_shift(comm_cart, 0, 1, &source, &dest)； 

/* 0 번 프로쎄스는 자기들끼리 “고리” 를 형성하는 “잎” 들에 

자료(자기의 번호값)를 전송한다. */ 

D[0]=0; D[1]=0; 

C=0; A=0; B=(int *)malloc(2 * size * sizeof(int))； 
for (i=0; i<2； i++) { 

B[i]=0; 

/* 자료를 “잎” 들에 보내기 */ 

MPI_Bcast(&A, 1, MPI—INT, 0, comm_gr)； 



/* “잎” 들로부터의 자료수집 */ 

MPI_Gather(D, 2, MPIJNT, B, 2, MPI_INT, 0, comm_gr)； 
printf("B=%d\n", B[i])； 

} 

/* 나머지 프로쎄스들에서의 동작 */ 

MPI_Bcast(&A, 1, MPI_INT, 0, comm_gr)； 

/* 자료처 리 */ 

A=A+rankgr; D[0]=A; 

MPI_Sendrecv(&A, 1, MPI_INT, dest,12, &C, 1, MPI_INT, source, 12, 
comm_l, &st)； 

D[1]=C; 

/* 뿌리등록부에 자료전송 */ 

MPI_Gather(D, 2, MPI_INT, B, 2, MPI_INT, 0, comm_gr)； 

/* “잎” 들에서 위상을 해방*/ 

MPI_Comm_free(&comm_cart)； 

MPI_Comm_free(&comm_l)； 

/* 모든 프로쎄스들을 해방 */ 

MPI_Comm_free(&comm_gr)； 

MPI_Finalize()； 
return 0； 


제 3 절 행렬에 벡토르급하기와 행렬에 

행렬 급하기 

목적: 행렬에 벡토르곱하기와 행렬에 행렬곱하기와 같은 알고리듬의 
병렬화수법들을 습득하는데 있다. 

[실례 8] “고리” 형위상에서 행렬에 백토르를 곱하는 문제이다. 

nl*n2 행 렬 A 와 n2 차 벡 토르 묘가 주어 졌을 때 C=A*B 를 계 산한다. 
행렬 A 와 벡토르 B 를 일정한 크기로 자르고 매 프로쎄스는 자기의 부분을 


생성한다. P1 개의 콤퓨터들로 이루어진 체계에서 프로그람을 실행하므로 
행렬 A 와 벡토르 묘를 pi 개의 가로대 역으로 나눈다. 행렬 A 와 벡토르 묘는 
pi 로 완전히 나누인다고 가정한다. 

프로그람에서는 pl=4 로 하였다. 


#include <stdio.h> 

#include <stdlib.h> 

#include <time.h> 

#include <sys/time.h> 

#include ” mpi.h” 

/* 매 프로쎄스에 A 와 요의 대역크기를 준다.*/ 

/* 이 크기 가 모든 프로쎄 스들에 서 같다고 가정한다.*/ 

#define M 16 
#define N 4 

/* DIMS - 데 카르트위 상의 크기，“고리 ” 는 1 차원이 다.*/ 

#define DIMS 1 

#define EL(x) (sizeof(x)/sizeof(x [0])) 

/* 대 역변수 */ 

static double A[N] [M], B[N]，C[N]; 

main(int argc, char **argv) 

{ 

int size, rank, i, j, k, il, sour, dest； 
int dims [DIMS]； 
int periods [DIMS] ； 
int reorder = 0； 

MPI_Comm comm_cart； 

MPI_Status st； 
double rt, tl, t2； 

MPI_Init(&argc, &argv)； 

/* 매 프로쎄스는 문제의 크기를 알아낸다. */ 

MPI_Comm_size(MPI_COMM_WORLD, &size)； 

/* 행렬 dims 초기화，“고리” 형위상을 위한 행렬 periods 값넣기*/ 



for (i=0 ； i<DIMS ； i++) { 
dims [i] =0; 
periods [i] =1; 

} 

/* (1 차원)살창크기 를 지 적 하는 dims 행 렬 값넣 기 */ 
MPI_Dims_create(size, DIMS, dims )； 

/* 통신기 comm_cart 를 가진 “ 고리 ” 위상 생성 */ 

MPI_Cart_create(MPI_COMM_WORLD, DIMS, dims, periods, 

reorder, &comm_cart )； 

/* 매 프로쎄스는 자기의 번호률 인식한다 .*/ 

MPI_Comm_rank(comm_cart, &rank )； 

/* 매 프로쎄스는 고리를 따라 번호가 작은 방향으로 자기의 이웃들을 
찾는다 .*/ 

MPI_Cart_shift(comm_cart, 0, -1 ， &sour, &dest )； 
for (j=0; j<N ； j++) 
for (i=0l i<M ； i++) { 

A[j] [i]=3.0; 

B[j]=2.0; 

C[j]=0.0; 

} 

/* 시작시간설정 */ 

tl=MPI_Wtime(); 

/* 매 프로쎄스는 자기 대역에서 곱하기를 진행 */ 

/* 맨 바깥순환 for (k) 는 콤퓨터 순환 */ 
for (k=0 ；k < size ； k++) { 
int d ； 

d=((rank+k)%size)*N ； 

/* 매 프로쎄스는 자기 대역에서의 곱하기를 진행 */ 

for (j=0; j<N ； j++) 

for (il=0, i=d; i<d+N ； i++, il++) 

C[j]+=A[j] [i]*B[il]; 


/* 매 프로쎄스는 낮은 번호의 린접프로쎄스에 B 의 대역을 전송 */ 
/* 즉 B 의 대역을 고리를 따라 밀기한다 . */ 



MPI_Sendrecv_replace(B, EL(B), MPI_DOUBLE, dest, 12, sour, 12, 
comm_cart, &st )； 

/* 곱하기 끝시간 측정 */ 
t2=MPI_Wtime ()； 
rt=t2-tl; 

printf("rank=%d Time=%d\n", rank, rt )； 

/* 결과출력 */ 

for (i=0 ； i<N ； i++) 

printf("rank=%d RM=%6.2f\n", rank, C [i ])； 
MPI_Comm_free(&comm_cart )； 

MPI_Finalize ()； 
return 0 ； 


[실례 9] “ 완전그라프 ” 위상에서 행렬에 벡토르를 곱하는 문제이다 . 

nl*n2 행 렬 A 와 n2 차 벡 토르 B 가 주어 졌을 때 C=A*B 를 계 산한다 . 
행렬 A 와 벡토르 B 를 일정한 크기로 자르고 매 프로쎄스는 자기의 부분을 
생성한다 . 매 콤퓨터에서 결과를 얻은 후 단일벡토르 묘로 집합하여 모든 
콤퓨터 들에 전송한다(이 것 은 반복알고리 듬에 서 한가지 반복모형 이 다 .). 
프로그람에서 는 콤퓨터 대수를 4 로 하였다 . 

#include <stdio.h> 

#include <stdlib.h> 

#include <time.h> 

#include <sys/time.h> 

#include "mpi.h" 

/* 매 프로쎄스에 A 와 B 의 대역크기를 준다 .*/ 

/* 이 크기가 모든 프로쎄스들에서 같다고 가정한다 .*/ 


#define M 16 
#define N 4 

/* DIMS 4 데카르트위 상의 크기，“고리 ” 는 1 차원이 다 .*/ 
#define DIMS 1 

#define EL(x) (sizeof(x)/sizeof(x [0] [0])) 


static double A[N] [M], B[N], C[N ]； 


main(int argc, char **argv) 

{ 

int size, rank, i, j ； 
double rt, tl, t2 ； 
int sour, dest ； 
int dims [DIMS ]； 
int periods [DIMS] ； 
int reorder = 0 ； 

MPI_Comm comm_cart ； 


MPI_Init(&argc, &argv )； 

/* 매 프로쎄스는 문제의 크기를 알아낸다 . */ 

MPI_Comm_size(MPI_COMM_WORLD, &size )； 

/* 매 프로쎄스는 자기의 번호률 알아낸다 . */ 

MPI_Comm_rank(MPI_COMM_WORLD, &rank )； 

/* 매 프로쎄 스는 A 와 B 의 대 역 을 생 성， C 의 대 역 을 초기 화 */ 
for (i=0;i<M;i++) 
for (j=0 ； j<N ； j++) { 

A[j] [i]=3.0; 

B[j]=2.0; 

C[j]=0.0; 

} 

/* 행렬 dims 초기화， “ 고리 ” 형위상을 위한 행렬 periods 값넣기 */ 
for (i=0 ； i<DIMS ； i++) { 
dims [i] =0; 
periods [i] =1; 

} 

/* (1 차원)살창크기 를 지 적 하는 dims 행 렬 값넣 기 */ 
MPI_Dims_create(size, DIMS, dims )； 

/* 통신기 comm_cart 를 가진 “ 고리 ” 위상 생성 */ 



MPI_Cart_create(MPI_COMM_WORLD, DIMS, dims, periods, 

reorder, &comm_cart )； 

/* 매 프로쎄스는 자기의 번호률 인식한다 .*/ 

MPI_Comm_rank(comm_cart, &rank )； 

/* 매 프로쎄스는 고리를 따라 번호가 작은 방향으로 자기의 이웃들을 
찾는다 . */ 

MPI_Cart_shift(comm_cart, 0, -1 ， &sour, &dest )； 

/* 시작시간설정 */ 
tl=MPI_Wtime(); 
for (j=0;j<N;j++) 

for (i=0 ； KM; i++) C [j] +=A [j] [i] *B [j] ； 

MPI_Allgather(C, EL(C), MPI_DOUBLE, B, N, MPI_DOUBLE, 
MPI_C0MM_W0RLD )； 

/* 매 프로쎄스는 풀이시간을 출력 ，0 번 프로쎄스는 벡토르 묘를 출력 */ 
t2=MPI_Wtime(); 
rt=t2-tl; 

printf("rank=%d Time=%f\n", rank, rt )； 

/* 결과출력 */ 

if (rank == 0) { 
for (i=0 ； i< N ； i++) 
printfC'B = %6.2f\n", B [i] )； 

} 

MPI_Finalize ()； 
return 0 ； 


[실례 10] “ 고리 ” 형위상에서 행렬에 행렬곱하기률 진행한다 . 
nl*n2 행렬 A 와 n2*n3 행렬 B 를 곱하여 nl*n3 행렬 C=A*B 를 계산 
한다 . 행렬 A, B 를 미리 대역으로 가르고 매 프로쎄스는 자기의 부분을 
계 산한다 . 

pl 개의 를퓨터들로 이루어진 “ 고리 ” 에서 프로그람을 실현한다 . 

행렬 A 를 pl 개의 가로대역으로 행렬 묘를 pl 개의 세로대역으로 나눈다 . 


여기에서는 매 콤퓨터에 행렬 A 의 하나의 대역과 행렬 B 의 하나의 
대역만을 넣는다고 가정한다 . 그리고 행렬 A 와 벡토르 묘는 pi 로 완전히 
나누인다고 가정한다 . 

프로그람에서는 pl=8 로 하였다 . 

#include <stdio.h> 

#include <stdlib.h> 

#include <time.h> 

#include <sys/time.h> 

#include "mpi.h" 

/* 매 프로쎄스에 A 와 B 의 대역크기를 준다 .*/ 

/* 이 크기가 모든 프로쎄스들에서 같다고 가정한다 .*/ 

#define M 320 
#define N 40 

/* DIMS 1 데카르트위 상의 크기，“고리 ” 는 1 차원이 다 .*/ 

#define DIMS 1 

#define EL(x) (sizeof(x)/sizeof(x[0] [0])) 


static double A[N] [M], B[M] [N], C[N] [M] ； 


main(int argc, char **argv) 

{ 

int size, rank, i, j, k, il, jl, sour, dest ； 
int dims [DIMS], periods [DIMS] ； 
int reorder = 0 ； 

MPI_Comm comm_cart ； 

MPI_Status st ； 
double rt, tl, t2 ； 

MPI_Init(&argc, &argv )； 

/* 매 프로쎄스는 문제의 크기를 알아낸다 . */ 

MPI_Comm_size(MPI_COMM_WORLD, &size )； 

/* 행렬 dims 초기화， “ 고리 ” 형위상을 위한 행렬 periods 값 넣기 */ 
for (i=0 ； i< DIMS ； i++) { 



dims[i]=0; 
periods [i] = 1 ； 


/* (1 차원)살창크기를 지적하는 dims 행렬값넣기 */ 

MPI_Dims_create(size, DIMS, dims )； 

/*communicator comm_cart 를 가진 “고리 ” 위 상 생성 */ 
MPI_Cart_create(MPI_COMM_WORLD, DIMS, dims, periods, 

reorder, &comm_cart )； 

/* 매 프로쎄스는 자기의 번호를 인식한다 .*/ 

MPI_Comm_rank(comm_cart, &rank )； 

/* 매 프로쎄스는 고리를 따라 번호가 작은 방향으로 자기의 린접프로쎄스 
들을 찾는다 . */ 

MPI_Cart_shift(comm_cart, 0, -1, &sour, &dest )； 
for (i=0 ； i<N ； i++) 
for (j=0; j<M ； j++) { 

A[i] [j] =3.141528 ； 

B[i] [j]=2.812; 

C[i] [j]=0.0; 


/* 시작시간 */ 
tl=MPI_Wtime(); 

/* 매 프로쎄스는 자기 대역에서 곱하기를 진행 */ 
/* 맨 바깥순환 for (k) 는 콤퓨터 순환 */ 
for (k= 1 ； k < size ； k++) { 
int d ； 


d=((rank+k)%size)*N ； 

/* 매 프로쎄스는 자기 대역에서의 급하기를 진행 */ 
for (j=0; j<N ； j++) 
for (il=0, jl=d ； jl<d+N ； il++, jl++) 
for (i=0; i< M ； i++) 

C[j] [i]+=A[j] [i] *B[i] [il]; 



/* 매 프로쎄스는 낮은 번호의 린접프로쎄스에 B 의 가로대역을 전송 
한다 . 즉 묘의 대역을 콤퓨터고리를 따라 밀기한다 . */ 

MPI_Sendrecv_replace(B, EL(B), MPI_DOUBLE, dest, 12, sour, 12, 
comm_cart, &st )； 

/* 곱하기끝시간측정 */ 
t2=MPI_Wtime ()； 
rt=t2-tl ； 

printf("rank=%d Time=%f\n", rank, rt )； 

/* 검사를 위하여 C 의 첫행의 첫 4 개 요소들을 출력 */ 
if (rank == 0) { 
for (i=0 ； i < 1 ； i++) 
for (j=0; j < 4 ； j++) 
printf("C[i] [j ]-%f \n", C[i] [j ])； 

} 

MPI_Comm_free(&comm_cart )； 

MPI_Finalize ()； 
return 0 ； 
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